Bookmarks

Hiện có 37 khách Trực tuyến
Định dạng cơ bản của các file tài liệu số In
Thứ năm, 25 Tháng 9 2014 04:11

Hiện nay, phát triển tài liệu số là một xu thế tất yếu của xã hội. Sự phát triển mang đến những tiện lợi và lợi ích cần thiết cho người sử dụng tài liệu. Các định dạng tài liệu số thường rất đa dạng, mỗi định dạng mang một đặc trưng phù hợp cho từng loại hình tài liệu nhằm phục vụ cho việc tối ưu hóa dung lượng và chất lượng của tài liệu. Nhưng do có quá nhiều định dạng khác nhau nên nó có thể mang đến những phiền phức không mong muốn cho chúng ta trong việc đọc và chia sẽ các tài liệu. Để tránh những rắc rối đó, chúng ta có thể tìm hiểu để biết thêm một số định dạng thường gặp của tài liệu số.

I/ PRC:

PRC là một định dạng ebook khá phổ biến tại Việt Nam. Đây là một dạng file nén được tối ưu hóa để lưu trữ, tải và hiển thị các loại dữ liệu 3D, đặc biệt là dữ liệu đại diện cho sản phẩm sản xuất.

Định dạng cho phép lưu trữ các file CAD ​​lớn trong một hình thức nén cao so với bản gốc.

Cấu trúc hoàn chỉnh của PRC được xác định bởi hệ thống CAD chứa trong một file PRC nhằm đáp ứng nhu cầu tài liệu 3D của sản phẩm sản xuất và các ngành công nghiệp liên quan.

Để đọc được các file này, bạn có thể sử dụng:

1. Trên máy tính để bàn (PC) hoặc máy tính xách tay (Laptop, notebook):

Sử dụng phần mềm Mobipocket Reader Desktop để đọc file PRC. Ngoài ra, các bạn cũng có thể sử dụng một số phần mềm khác như Kindle for PC hoặc Stanza Deskop,… tuy nhiên Mobipocket Reader vẫn là sự lựa chọn số một.

Link download: http://goo.gl/BN2h3

2. Trên các thiết bị cầm tay của Apple (Hệ điều hành IOS) hoặc các thiết bị chạy hệ điều hành Android (smartphone, tablet):

Các bạn có thể sử dụng phần mềm App Kindle (tải qua App Store hoặc Android Market).

II/ EPUB:

      Định dạng ePub (viết tắt của Electronic Publication) là một định dạng file chuẩn được dùng cho việc lưu trữ và đọc ebook trên các thiết bị di động (phổ biến gần đây nhất là iPad, iPhone, điện thoại di động nói chung…), được phát triển bởi International Digital Publishing Forum. Đây là định dạng được thiết kế sao cho những văn bản hiển thị trên màn hình có thể được tối ưu hóa cho các thiết bị hiển thị cụ thể được sử dụng bởi người đọc.

      Khi bạn chỉnh lại kích cỡ cửa sổ hiển thị thì các dòng chữ sẽ được tự động chỉnh lại cho phù hợp với lề phải của trang văn bản, khi hết dòng là tự động xuống dòng mà không “bẻ” (break) các từ đó ra.
Định dạng ePub cũng chẳng khác gì so với các định dạng file PDF hay PRC. Tuy nhiên, hiện nay trên thế giới dạng file ePub đang được hỗ trợ phát triển rất nhanh, lấn át cả PRC và PDF.

Đọc file ebook định dạng ePub:

  • Nếu bạn dùng trình duyệt Firefox thì có thể cài Add-ons mang tên ePub Reader để biến Firefox thành một công cụ đọc file ePub tuyệt vời.
  • Bạn cũng có thể sử dụng phần mềm Mobipocket Reader Desktop kể trên để đọc file ePub trên máy tính.
  • Nếu bạn đọc trên iPhone, iPad (Hệ điều hành iOS thì có app mặc định của Apple là iBooks) và trên các thiết bị chạy hệ điều hành Android là: Aldiko hoặc FBReaderJ.

III/ MOBI:

      MOBI (hay Mobipocket) là một dạng khác của phiên bản ban đầu của ePub, được công ty cùng tên phát triển làm định dạng để sử dụng với phần mềm đọc e-book của họ, ban đầu được thiết kế cho các thiết bị trợ giúp kỹ thuật số cá nhân PDA (personal digital assistant) và sau này dùng cho smartphone. Sau khi Amazon mua lại công ty này, họ đã dùng MOBI làm cơ sở cho định dạng e-book riêng của thiết bị đọc sách Kindle. MOBI hỗ trợ quản lý bản quyền kỹ thuật số DRM (Digital Rights Management), nhưng các tài liệu MOBI không được mã hóa và có thể đọc được trên Kindle.

Link download: http://goo.gl/BN2h3

IV/ PDF:

      PDF (Portable Document Format, "Định dạng Tài liệu Di động") là một định dạng tập tin văn bản khá phổ biển của hãng Adobe Systems. Tương tự như định dạng Microsoft Word (.doc), PDF hỗ trợ văn bản thô (text) cùng với font chữ, hình ảnh đồ họa và nhiều hiệu ứng khác. Tuy nhiên, việc hiển thị văn bản PDF không phụ thuộc vào môi trường làm việc của người sử dụng (cấu hình máy, phần mềm và hệ điều hành). Không như văn bản Word, một văn bản PDF sẽ được hiển thị giống nhau trên những môi trường làm việc khác nhau nếu như file PDF đó đã được tạo hiệu ứng nhúng font chữ (Embedded Subset). Chính vì ưu điểm này, định dạng PDF đã trở nên phổ biển cho việc phát hành sách, báo, tạp chí hay các tài liệu khác qua mạng Internet.

      Ưu điểm định dạng PDF là loại bỏ metadata trong văn bản gốc (ví dụ như các thay đổi được lưu giữ trong các file DOC), giúp hạn chế tiết lộ thông tin nội bộ. Chính vì thế, các văn bản trước khi gửi ra ngoài tổ chức hay đưa lên các website thường được chuyển sang định dạng PDF. Một ưu điểm nữa là các tệp PDF thường rất khó chỉnh sửa và có thể thiết lập chế độ bảo mật tương đối dễ dàng (ví dụ như cấm in, cấm sao chép nội dung).
Chúng ta có thể sử dụng một số phần mềm sau để đọc định dạng PDF:

V/ CHM:

      Định dạng CHM là 1 dạng lưu trữ nhiều trang Web và được tổ chức dưới dạng cây thư mục.Ưu điểm của định dạng này là linh hoạt khi sao chép sang máy khác file vẫn thể đọc được ở bất kỳ máy tính nào sử dụng hệ điều hành Window XP SP2 trở lên mà không cần cài thêm bất kỳ chương trình hỗ trợ nào.

      Cấu trúc định dạng CHM được tổ chức dưới dạng cây thư mục dễ nhìn và có kích thước thấp hơn các file dạng khác cùng nội dung cho nên việc chia sẽ các file CHM sẽ dễ dàng và nhanh chóng hơn.

      Để là việc trực tiếp với file định dạng CHM, bạn cần sử dụng các phần mềm chuyên dụng như HTM2CHM (chuyển đổi các file htm hay html sang chm) hoặc CHM Decoder (chuyển đổi ngược lại).

V/ DJVU:

      DjVu (Phát âm là "déjà vu") là một công nghệ nén hình ảnh mới được phát triển từ năm 1996 tại AT & T Labs. DjVu cho phép phân phối trên Internet các hình ảnh độ phân giải rất cao của các tài liệu quét, tài liệu kỹ thuật số và hình ảnh. DjVu cho phép các nhà phát triển nội dung để quét độ phân giải cao màu sắc trang sách, tạp chí, catalog…

      Những ưu điểm của DjVu là có thể thay thế cho các định dạng PDF, PS, TIFF, JPEG, và GIF trong việc trao đổi các tài liệu ảnh quét, tài liệu số, các loại ảnh có độ phân giải cao. Nội dung trong DjVu tải nhanh hơn, hiển thị nhanh hơn, trông đẹp hơn trên màn hình và tốn ít tài nguyên hơn hầu hết các định dạng tài liệu khác. Hình ảnh của DjVu có thể giãn to và thu nhỏ một cách mịn màng.

DjVu Reader là chương trình dùng để xem các file có định dạng DjVu.

Download tại:http://djvu.org/resources/

      Những định dạng tài liệu số trên là những dạng cơ bản mà chúng ta thường gặp trong quá trình tiếp xúc tài liệu. Tuy nhiên nó chỉ là một phần nhỏ trong sự phát triển mạnh mẽ của tài liệu số. Sự phát triển của nó sẽ mang đến cho chúng ta nhiều cơ hội tiếp cận một cách dễ dàng và khoa học với nguồn tri thức trên Thế giới dù bất cứ ở đâu và thời gian nào.

TÀI LIỆU THAM KHẢO

  1. [Tham khảo tại: http://wiki.mobileread.com/wiki/MOBI]
  2. [Tham khảo tại: http://en.wikipedia.org/wiki/EPUB]
  3. [Tham khảo tại: http://vi.wikipedia.org/wiki/PDF]
  4. AT&T Labs.Truy cập ngày 09/09/2014, từ: http://djvu.org/resources/
  5. . Truy cập ngày 09/09/2014, từ: (http://www.fbreader.org/FBReaderJ/)
  6. Nguyễn Anh Tuấn (2009). Những điều cần biết về định dạng tệp PDF
  7. Nguyễn Lệ Nhung (2014). Định dạng tài liệu điện tử PDF (Truy cập ngày 09/09/2014, từ: http://vanthuluutru.com/)

 

 

Phạm Lê Giang

                                                                    Trung tâm Học liệu – Đại Học Cần Thơ