Hướng dẫn chuyển đổi-biên tập các định dạng video

Đây là bài viết Hướng dẫn chuyển đổi-biên tập các định dạng video trong box Multimedia & Đồ Họa, một box của chuyên mục Thủ Thuật; Thread này sẽ tập trung những bài viết có liên quan đến cách thức tạo những tập tin nghe nhìn ...

Trang 1/2 1 2 cuốicuối
kết quả từ 1 tới 15 trên 23
  1. wookie - 24-11-2006 07:25 PM
    Thread này sẽ tập trung những bài viết có liên quan đến cách thức tạo những tập tin nghe nhìn chơi trên máy tính và các thiết bị gia dụng.

    Các bài viết liên quan tới Hướng dẫn chuyển đổi-biên tập các định dạng video:

  2. wookie - 24-11-2006 07:26 PM
    MPEG-4 là gì?

    MPEG-4(Moving Picture Experts Group-4) là một chuẩn Multimedia mở vô cùng rộng lớn được phát triển bởi Moving Picture Experts Group-một nhóm thuộc tổ chức quốc tế về tiêu chuẩn hóa(International Organization for Standardization-ISO).Lưu ý rằng chính nhóm này đã phát triển hai chuẩn audio/video hiện nay đang phổ biến trên toàn thế giới là MPEG-1(VCD) và MPEG-2(DVD,SVCD).

    MPEG-4 còn được giới am hiểu thông tin hiểu là ISO 14496-được thiết kế không nhằm vào việc sản xuất ra một sản phẩm cụ thể nào(giống như MPEG-2 gắn liền với DVD),nó chỉ đưa ra những tiêu chuẩn bắt buộc phải tuân theo,và những nhà cung cấp sẽ dựa vào khuôn mẫu có sẵn đó để phát triển những định dạng của mình.Dựa trên ý tưởng đó,mpeg-4 đề ra nhiều tiêu chuẩn phụ với các tác dụng sau:

    -ISO 14496-1 systems: Dùng để tạo những tính năng hỗ trợ cho hệ thống MPEG-4:giống như DVD menu hay chapter.

    -ISO 14496-2 video: là phần hình ảnh của MPEG-4,được mã hóa và giải mã bởi những Advanced Simple Profile (ASP) codec.ASP codec điển hình là DivX,XviD,3ivX,NeroDigitalASP...

    -ISO 14496-3 audio:sử dụng Advanced Audio Coding (AAC),là phần âm thanh của MPEG-4,hiện nay có khá nhiều định dạng âm thanh hỗ trợ cho MPEG-4 như MP3,AAC,OGG,AC3,DTS...

    -ISO 14496-4 Conformance : những test nhất định được tiến hành để kiểm tra độ tương thích của bitstream và decoder với các phần 1,2,3,6.

    -ISO 14496-5 Reference Software : Những software dành cho MPEG-4 chưa được tối ưu hóa.

    -ISO 14496-6 Delivery Multimedia Integration Framework

    -ISO 14496-7 Optimised software for MPEG-4 tools

    -ISO 14496-8 4 on IP framework : framework dành cho việc truyền phát MPEG-4 stream trên mạng lưới IP.

    -ISO 14496-10 video:đây là dạng mới hơn dành cho phần hình ảnh của MPEG-4.Thay vì sử dụng ASP codec,nó sử dụng Advanced Video Coding (AVC),các AVC codec ra đời sau ASP codec và còn trong giai đoạn phát triển ban đầu với nhiều chi tiết chưa thật sự hoạt động tốt,nhưng rõ ràng từ ASP đến AVC là một bước tiến lớn.Các AVC codec được biết đến nhiều nhất gồm có x264,NeroDigitalAVC.

    -ISO 14496-14 container:định dạng dùng để kết hợp hệ thống MPEG-4(có thể gồm có các kênh âm thanh,hình ảnh,chapter,phụ đề.file đính kèm...)

    -ISO 14496-17 subtitles: phụ đề dạng ký tự dành cho MPEG-4.Xem hướng dẫn VobSub để rõ hơn.

    MPEG-4 mang tới một chất lượng streaming tốt hơn ở một dung lượng thấp hơn so với các dạng streaming hiện nay.

    MPEG-4 được xây dựng cho các mục đích chính sau:
    -Truyền hình kỹ thuật số (Digital Television -DT)
    -Ứng dụng đồ họa tương tác.
    -Multimedia tương tác

  3. wookie - 24-11-2006 07:30 PM
    Simple Profile(SP) là profile sơ cấp nhất cho việc mã hóa video thành dạng mpeg-4,SP không có bất kỳ công cụ đi kèm nào để tác động tới file output,điều duy nhất có thể làm với SP là đặt frame size và frame fer second(fps)
    Advanced Simple Profile(ASP) là dạng cải tiến của SP,tích hợp thêm một số tùy chọn quan trọng để điều chỉnh file output theo mềm dẻo hơn theo ý người sử dụng như B-Frames,QuarterPixel Motion Estimation, Global Motion Compensation,MPEG/Custom Quantization.

    B-Frames/B-VOPS/Bi-directional encoding/prediction:
    Ở giai đoạn bạn đầu,SP có hai loại frame được áp dụng để mã hóa mpeg-4,đó là I-frame và P-frame.
    I-frame là một khung hình hoàn chỉnh và không cần nhận hỗ trợ từ frame khác,nó còn gọi là *** frame.
    P-frame là frame chỉ bao gồm những phần khác biệt(có sự thay đổi thay đổi)từ P-frame hay I-frame trước.
    Với ASP,ngưới sử dụng được tiếp xúc với một loại frame khác,đó là B-frame.Loại frame này được xây dựng để sử dụng dữ liệu từ những frame đứng cạnh nó(có thể là I hay P).B-frame có thể được nén rất nhiều so với các loại frame khác do đó làm giảm đáng kể dung lượng của file video có sử dụng nó.Những ASP codec có hỗ trợ B-frame được sử dụng nhiều nhất là Divtừ 5.0 hay cao hơn),XviD…một codec rất nổi tiếng nhưng chưa hỗ trợ loại frame này là 3ivx.

    Quarter Pixel Motion Search Precision (QPEL):
    Theo mặc định,hầu hết các codec dành cho mpeg-4 đều nhận diện chuyển động với đơn vị là ½ điểm ảnh (HalfPel).Với QPEL,người sử dụng có thể dò chuyển động với đơn vị là ¼ điểm ảnh,như vậy độ chính xác được tăng lên gấp đôi.Với độ phân tích cụ thể gấp đôi(¼ thay vì ½),hình ảnh thu được cũng sẽ sắc nét hơn rất nhiều.

    Global Motion Compensation (GMC):
    GMC sử dung một vectơ chuyển động đơn (single motion vector) cho tất cả những phần chuyển động tương tự như nhau với những frame nó cho là có nhiều phần chuyển động.GMC sẽ giúp lưu lại những phần chuyển động nhỏ khi panning, zoom.Như vậy,với GMC,chuyển động sẽ trở nên sắc nét hơn ngay cả khi tạm dừng,phóng to hình ảnh…qua đó cải thiện chất lượng hình ảnh.

    MPEG/Custom Quantization:
    Ở SP,người sử dụng chỉ có thể sử dụng loại quantization là H.263,ASP cung cấp thêm một tính năng vượt trội hơn hẳn:người sử dụng có thể tự thiết lập quantization matrix riêng cho mình.H.263 quantization mặc định được thiết kế cho việc encode với bitrate thấp.Khi dùng nó,kết quả thu được sẽ là video có hình ảnh mịn-hơi mờ giống như khi áp dụng bộ lọc Blur trong Photoshop.Nếu trong codec mình đang sử dụng,bạn có thể chọn MPEG matrix,thì nên nhớ đây là matrix dành cho mpeg-4 với bitrate cao và sẽ không hợp lý khi dùng nó cho việc encode bitrate thấp.
    Hiện nay trên thế giới phổ biến khá nhiều Custom Matrix tối ưu cho từng truờng hợp,nếu không thể tự xây dựng một Custom Matrix cho riêng mình,bạn có thể sử dụng Google để dễ dàng search thấy một và Matrix cần thiết.


    Adaptive Quantization:
    Trong quá trình encode với bitrate biến thiên(Variable Bitrate),khi sử dụng AQ,mỗi frame có thể được nén với những quantizer khác nhau.Thông qua một trình điều khiển của codec gọi là rate control,các frame khác nhau sẽ được cung cấp những quantizer khác nhau phụ thuộc vào bản chất hình ảnh của chúng.Ví dụ những phần chuyển động hay những phần hình ảnh sẫm màu khó nhận biết sẽ được xử lý với quant lớn hơn(độ nén cao hơn,dung lượng nhỏ hơn),những phần hay được hệ thống mắt người chú ý nhiều hơn sẽ được xử lý với quant thấp hơn(độ nén nhỏ hơn,dung lượng lớn hơn).

    Với rất nhiều người dùng hiện nay,codec ASP nổi tiếng nhất được biết tới là DIVX,hiện nay đã phát triển một định dạng container mpeg-4 của riêng mình với phần mở rộng là .divx.Nhưng bạn nên biết rằng,ngoài DIVX codec,còn có rất nhiều ASP codec khác cũng mạnh mẽ và tương thích không kém.

    Một số MPEG-4 ASP codec:

    Dưới đây là bản danh sách một vài ASP codec :
    3ivx http://www.3ivx.com/
    XviD http://www.xvid.org/
    DivX http://www.divx.com
    DivX4/OpenDivX http://www.projectmayo.com/
    Nero Digital http://www.nerodigital.com/
    QuickTime http://www.apple.com/quicktime/download/
    Envivio http://www.envivio.com/
    Sorenson http://www.sorenson.com/
    Ffmpeg http://ffmpeg.sourceforge.net/
    ffdshow/ffvfw http://cutka.szm.sk/

    Một số codec như RV9,VP7 và WMV9 không phải là codec hoàn toàn tương thích với mpeg-4 tiêu chuẩn.

    Sơ qua về những ASP codec hàng đầu hiện nay:

    DivX
    Chắc chắn đây là codec đầu tiên cần được nhắc tới.Có thể nói đây là ASP codec nổi tiếng nhất,được sử dụng rộng rãi nhất trên thế giới hiện nay.Codec này cung cấp những tính năng ASP như QPEL,GMC(chỉ hỗ trợ 1 warpoints để vẫn có thể phát được trên một số thiết bị chuyên dụng),B-frame(chỉ cho phép tối đa 2 B-frame kề nhau),quant H.263 và MPEG(không thể tự tạo Custom Matrix).DivX là một codec mang tính thương mại cao,DivX Networks liên kết với rất nhiều công ty,tập đoàn khác để tạo nên những sản phẩm(phần cứng,phần mềm) tương thích với video sử dụng codec của họ.Hiện nay,DivXNetworks cũng đã nâng codec của họ lên một tầm cao mới khi công bố container .divx với những tính năng đồng bộ hầu như có thể tạo được một movie mpeg-4 có những chức năng giống hệt DVD.

    XviD
    Đây là một codec miễn phí và được xây dựng hoàn toàn bởi sự đam mê của nhóm tác giả.Có lẽ hiện nay,đây là ASP codec được giới encode đánh giá cao nhất.XviD cung cấp tất cả những gì một ASP codec có thể mang lại với B-frame(không giới hạn số B-frame liền nhau),QPEL,GMC(hỗ trợ tới 3 warpoints,lưu ý hiện tại không có loại thiết bị chuyên dụng nào có thể giải mã được mpeg-4 với 3 warpoints GMC), H.263/MPEG/Custom Quants,Adaptive Quants…XviD là sự kết hợp tuyệt vời giữa tốc độ,chất lượng và khả năng tùy biến cao.

    3ivx
    Là một trong những mpeg-4 codec đầu tiên.3ivx cung cấp tín năng H.263/MPEG Quants, Adaptive Quant,4 Vector Motion nhưng không có B-Frames, GMC và QPEL).3ivx là codec đầu tiên cho phép chọn Pixel Aspect Ratio hoàn toàn theo ý muốn(Custom PAR).

    Nero Digital
    Một ASP codec được phát triển bởi Nero trong thời gian gần đây.Dù xuất hiện sau,nhưng codec này đã nhanh chóng tìm được chỗ đứng với một chất lượng encode khá tốt và tốc độ ấn tượng.Nero Digital hỗ trợ 1 B-frame,GMC(3 warppoints), QPEL, h.263/MPEG/Custom Quants, Adaptive Quant.


    Sự tương thích của MPEG-4 ASP codec với các thiết bị chuyên dụng:
    Những loại chip giải mã dành cho thiết bị chuyên dụng đầu tiên không có khả năng hỗ trợ một vài tính năng của ASP codec(ví dụ như QPEL,GMC).Những chip giải mã thế hệ mới có thể hỗ trợ QPEL và GMC với chỉ 1 warppoint(không có bất cứ chip nào hỗ trợ 3WP GMC).Để đảm bảo sự tương thích cho file mpeg-4 với các lọai chip giải mã cũ,một khái niêm mới được đưa vào,đó là “private MPEG-4 Profiles”.Ví dụ với DivXNetworks,họ đưa ra 4 loại Certification profile gồm có Handheld,Portable,Hom Theater,High Definition.Các profile loại này sẽ không cho phép sử dụng những ASP tool có thể làm giảm tương thích của video với thiết bị.Do đó,sự tương thích đã bị đánh đổi bằng chất lượng.

  4. wookie - 24-11-2006 07:33 PM
    Chuẩn mã hóa mpeg-4 mới nhất- AVC/H.264 được hoàn thành gần như đồng thời vào năm 2003 bởi 2 nhóm,nhóm MPEG (Moving Pictures Experts Group) trực thuộc ISO và nhóm VCEG (Video Coding Experts Group) của ITU (International Telecommunication Union),một tổ chức nhỏ thuộc United Nations (UNO),đã tiêu chuẩn hóa dịnh dạng H.263(đang được dùng rất phổ biến)
    AVC/H.264 tiêu chuẩn được phát triển bởi Joint Video Team (JVT),là một nhóm được thành lập từ việc sát nhập hai nhóm MPEG và VCEG.
    Với nhóm MPEG,codec này được gọi là MPEG-4 Part 10 (ISO 14496-10).Với ITU,nó được gọi là H.264.Hiện nay,codec dạng này được biết đến dưới tên gọi thống nhất do MPEG đề ra: Advanced Video Coding (AVC).

    AVC/H.264 Profile:
    AVC/H264 tiêu chuẩn có 4 profile:

    -Baseline.Cung cấp tùy chọn I/P-Frames,hỗ trợ progressive và CAVLC.
    -Main.Cung cấp tùy chọn I/P/B-Frames,hỗ trợ progressive và interlaced,CAVLC hay CABAC
    -Extended. Cung cấp tùy chọn I/P/B/SP/SI-Frames,hỗ trợ progressive và CAVLC.
    -High.Cung cấp tùy chọn I/P/B-Frames,hỗ trợ progressive và interlaced,CAVLC hay CABAC.8x8 intra prediction, custom quants, lossless video coding,yuv formats (44...)

    Những công cụ cơ bản của AVC codec:

    CAVLC/CABAC:
    AVC/H.264 đưa ra 2 công cụ mới cho việc mã hóa entropy của cú pháp bitstream(macro block-type, motionvectors + reference-index...) so với ASP codec.Đó là Context-Adaptive Variable Length Coding (CAVLC) và Context-Adaptive Binary Arithmetic Coding (CABAC).
    CABAC,được so sánh với CAVLC(UVLC),phương pháp mặc định trong AVC/H.264,là một phương pháp nén mạnh mẽ hơn,nó được giới thiệu là làm hạ bitrate thêm tới khoảng 10 đến 15%(đặc biệt là với bitrarte cao). CABAC (như CAVLC) là một phương pháp lossless và vì vậy sẽ không hề ảnh hưởng tới chất lượng,nhưng sẽ làm chậm cả quá trình mã hóa và giải mã.

    Bộ lọc Loop/Deblocking:
    Trái ngược với prefiltering (thực thi trên file đưa vào-avisynth) hay postprocessing/filtering (thực thi trên file xuất ra cuối cùng), LoopFiltering được áp dụng trong suốt quá trình encode trên mọi frame đơn lẻ,sau khi nó được encode,nhưng trước đó nó sẽ được sử dụng để tham khảo cho những frame đến sau.Cải tiến mới này sẽ giúp tránh được hiện tượng blocking artifact,đặc biệt là với bitrate thấp.Nhưng tốc độ mã hóa,giải mã sẽ bị giảm sút.

    Variable Block Sizes/Macroblock Partitions:
    Vượt trội hơn ASP codec(với block size dao động giữa 16x16 và 8x8 pixel),AVC/H.264 cung cấp cho Motion Search Precision một sự phân chia linh hoạt hơn với 1 macroblock có thể giảm kích cỡ xuống còn 4x4(bao gồm cả những block như 8x4…).Kích cỡ của block là có thể tùy biến và thay đổi (adaptive/variable).Như vậy, 1 codec và trình hỗ trợ encode có thể đủ thông minh để quyết định lựa chọn size nào là thích hợp nhất cho mỗi macroblock xác định.

    Multiple Reference Frames:
    Không giống như với mpeg-4 ASP(chỉ sử dụng frame trước frame hiện tại đang xử lý để tham khảo),AVC/H.264 cung cấp nhiều sự lựa chọn hơn cho một frame trong quá trình tìm kiếm chuyển động.Có nghĩa là codec có thể chọn lựa một tham khảo đơn giản tới frame trước nó(giống như ASP) hay tới một frame trước đó nữa.Ví dụ một P-frame có thể tham khảo một frame trước I-frame gần nhất.Với sự liên kết giữa các frame được mở rộng như vậy,một loại frame mới cũng được thêm vào: IDR-Frame,là những I-frame phía trước nhưng không đứng liền kề frame được nó cho tham khảo.Multiple reference frames sẽ là chậm quá trình mã hóa và giải mã,đồng thời quá trình cắt một file AVC/H.264 dạng này sẽ chỉ thực hiện được tại những IDR-frame.

    Weighted Prediction:
    Với những đoạn film có hiệu ứng mờ dần(những frame đến sau rất giống so với những frame ngay trước nó,chỉ có sắc độ là khác một chút),WP có thể hỗ trợ quá trình mờ dần hay tối dần khung hình.Mặc dù vậy,WP sẽ không hỗ trợ trong trường hợp chuyển cảnh.

    Rate Distortion Optimization (RDO):
    RDO giúp cho trình encode có thể đạt được hiệu suất xử lý mã hóa cao nhất khi phải lựa chọn giữa nhiều tùy chọn.RDO không phải là một công cụ được định nghĩa bởi AVC/H.264 nhưng với nó,người sử dụng có một phương pháp tiếp cận xử lý mới được giới thiệu bởi phần mềm H.264.Các codec khác cũng có thể sử dụng RDO,như XviD với VHQ mode đã có sẵn RDO.

    Về tốc độ mã hóa và giải mã.
    AVC/H.264 codec chậm hơn rất nhiều so với ASP codec do tích hợp những công cụ tiên tiến đã được đề cập ở trên.Hiện tại,hai AVC/H.264 codec có tốc độ tốt nhất kèm theo một chất lượng hình ảnh xứng đáng là X264 và NeroDigitalAVC,mặc dù vậy tốc độ của chúng cũng chưa thể só sánh được với những ASP codec đã quá quen thuộc như DivX hay XviD.Nhưng việc mã hóa và giải mã AVC/H.264 cũng được nhận một sự trợ giúp đắc lực từ những nhà sản xuất CPU tốc độ cao như Intel và AMD bởi những thế hệ máy tính để bàn mới hiện nay đều có tốc độ xử lý rất nhanh và hoàn toàn có thể đáp ứng được yêu cầu tốc độ của codec mới này.

    Một số AVC/H.264 encoder

    Apple
    Apple hỗ trợ 2pass, max 1 B-frame, Adapt. Quant, multiple Slices, không hỗ trợ CABAC, Loop và Weighted Prediction.Tìm thêm thông tin tại http://www.apple.com/quicktime/

    NeroDigital AVC
    ND AVC hỗ trợ 2pass, CABAC, (adaptive) Loop, multiple B-Frames, mulitple Reference Frames, weighted prediction, 8x8 P-Frame Blocksizes, 16x16 B-Frame Blocksizes, Adaptive Quant. (Psy High)


    Moonlight
    Sử dụng với Moonlight's OneClick Compressor v1.1 và CyberLink's PowerEncoder,
    Hỗ trợ 1pass (VBR/CBR/Fixed Quants), CABAC, Loop, 2 B-Frames, 8x8 P-Frame Sizes, Adapt. Quant, PAR, Interlacing.

    X264
    Là High Profile đầu tiên được công bố đại chúng,là một nguồn mở,miễn phí.
    X264 hỗ trợ Npass encode, CABAC, Loop, multiple B-Frames, B-References, multiple Reference Frames, 4x4 P-Frame, 8x8 B-Frame Blocksizes, anamorphic signalling và High Profile: 8x8 dct và intra prediction, lossless và custom quant matrices cùng một loạt tùy chọn phụ khác.


    Một số bộ giải mã AVC/H.264

    Apple: bộ giải mã AVC của Quicktime 7.

    Ffmpeg: một nguồn mở,được tích hợp trong một số bộ codec miễn phí như ffdshow (VFW và DShow decoder), mplayer và VideoLAN
    Hỗ trợ B-Frames, B-References, CABAC, Loop, Weighted Prediction và High Profile (8x8 dct,intra prediction, lossless)

    NeroDigital AVC:bộ giải mã của NeroDigital,hỗ trợ Main Profile và High Profile

    Moonlight:bộ giải mã của Moonlight tích hợp trong Moonlight's MPEG Player v3.0
    Hỗ trợ Main Profile High Profile.

    Sự tương thích của MPEG-4 AVC codec với các thiết bị chuyên dụng:

    Hiện tại,ngoại trừ computer,không có bất cứ một thiết bị nào được công bố rộng rãi là có khả năng giải mã tốt AVC/h.264 codec.Ngay cả bản thân codec này cũng chưa đạt đến một độ tương thích rộng rãi trên PC.Theo một vài nguồn tin,có thể trong tương lai,codec này sẽ được áp dụng cho HD-DVD để trở thành chuẩn video thông dụng tiếp theo thay thế cho chuẩn DVD hiện nay.

  5. wookie - 24-11-2006 07:34 PM
    Bitrate

    Là dung lượng mà thiết bị lưu trữ cần có để lưu trữ một giây âm thanh (hay video) tính theo bit (8bit=1byte).

    Sample

    Là một bộ phận của âm thanh analog được mã hóa thành dạng số.
    Sample có thể dùng để chỉ một điểm đơn lẻ trong stream âm thanh số (là đơn vị nhỏ nhất của dữ liệu dùng để biểu diễn một tín hiệu âm thanh tại một khoảng thời gian nhất định).
    Một âm thanh hoàn chỉnh hay toàn bộ một stream âm thanh số được cấu tạo từ việc kết hợp những sample riêng biệt ( một chuỗi sample ) cũng có thể được coi là một sample.

    Sample Rate

    Là số sample (tạm dịch là mẫu) trong một khoảng thời gian nhất định (thường là 1 giây) của âm thanh kỹ thuật số ,quyết định trực tiếp tới chất lượng âm thanh.Khi một tập tin âm thanh dạng số được ghi lại,nó phải được convert vào một chuỗi những mẫu (series of samples ) mà bản thân chúng có thể lưu lại được trên bộ nhớ ,trên các thiết bị lưu trữ kỹ thuật số.Sample rate sẽ thông báo cho ta biết trong tập tin âm thanh có bao nhiêu mẫu được ghi lại trong một giây.Đơn vị của sample rate là Hz .Ví dụ dễ hiểu ,một tập tin âm thanh được ghi ở sample rate 44100 sẽ cần đến 44100 mẫu/giây để lưu giữ âm thanh trong một chuỗi mẫu.Sample rate càng cao ,chất lượng của chuỗi mẫu càng tốt và càng ít xảy ra hiện tượng gọi là aliasing (là hiện tượng xuất hiện những tần số âm thanh không mong muốn sinh ra bởi việc thiếu hụt thông tin từ sample rate).Mỗi mẫu sẽ cần một lượng bit nhất định để lưu trữ gọi là sample size,và ta có thể tính toán dung lượng cần thiết cho một sample.Ví dụ ,với âm thanh 16 bit ,ta cần sử dụng 16 bit hay 2 byte cho một mẫu (8 bit=1 byte).Như vậy 1 giây âm thanh với sample rate 44100/16 bit mono (một kênh âm thanh) sẽ có độ lớn là 44100x2=88200 byte.Nếu cũng với các thông số như vậy nhưng thay vì mono ,ta sử dụng stereo (2 kênh âm thanh), dung lượng sẽ phải nhân đôi và trở thành 176400 byte.Đây là lý do vì sao âm thanh vòm (5.1) hay các loại âm thanh sử dụng nhiều kênh khác (6.1 ,7.1...) lớn hơn rất nhiều so với âm thanh stereo hay mono mặc dù chúng cũng được nén ở cùng chất lượng.

    Lossy, lossless và uncompressed

    Âm thanh uncompressed là loại âm thanh không áp dụng bất kỳ một phương pháp nén nào.Được sử dụng dưới định dạng WAV hay PCM.

    Âm thanh lossless là loại âm thanh sử dụng phương pháp loại bỏ những dữ liệu không liên quan tồn tại trong file gốc để thu được một file nhỏ hơn nhưng vẫn giữ được chất lượng như ban đầu.Âm thanh xử lý lossless sẽ có bitrate thấp hơn so với âm thanh chưa nén.Âm thanh lossless được sử dụng rộng rãi và phát triển thành những định dạng quen thuộc như AC3, AAC, DTS, MPEG-1/2/3, Vorbis, Real Audio…

    Âm thanh lossy là loại âm thanh thu được khi sử dụng những phần mềm encode âm thanh phổ biến hiện nay để chuyển đổi các định dạng âm thanh.Đây là loại âm thanh bị giảm chất lượng vì quá trình lossy encode sẽ không giữ nguyên những phần cần thiết trong file âm thanh gốc.Lấy ví dụ,khi encode từ WAV sang MP3,bạn đã thực hiện phương pháp lossy encode cho file âm thanh WAV chưa nén của mình,và file MP3 thu được đã bị giảm chất lượng so với file gốc,nó là âm thanh lossy.Mọi chuyện thậm chí còn tồi tệ hơn với việc encode file MP3 lossy đó thành OGG(có thể là định dạng khác),file OGG thu được đã bị quá trình encode lossy giảm chất lượng tới 2 lần.Đó là lý do bạn không nên encode quá nhiều lần một file âm thanh nhất định.Bạn cũng có thể nhận thấy sự mất chất lượng rõ ràng của dạng encode này khi nghe một CD nhạc ở dạng “theo yêu cầu” được các chủ hàng đĩa nhạc cung cấp,đơn giản bởi những đĩa CD đó không lấy nguồn uncompressed hay lossless như quá trình thu CD công nghiệp mà burn từ những file âm thanh lossy (mp3,wma…) download từ internet.

    CBR/ABR/VBR

    CBR-Constant bitrate-nghĩa là bitrate của stream là một hằng số và không thay đổi tại bất kỳ điểm nào của stream.
    ABR-Average bitrate-nghĩa là stream có thể sử dụng bitrate thay đổi cho mỗi frame,nhưng bitrate trung bình của toàn bộ stream là cố định.
    VBR-Variable bitrate-nghĩa là stream có thể sử dụng bitrate thay đổi cho mỗi frame và tùy biến để đạt được bitrate cần thiết cho mỗi frame,vì vậy bitrate trung bình không thể xác định trước khi encode hay tính toán cụ thể.

    Stereo, joint stereo, và dual channel

    Dual channel tích hợp bởi 2 kênh mono,nghĩa là mỗi kênh sẽ được encode với một nửa của toàn bộ bitrate.
    Stereo tích hợp bởi 2 kênh âm thanh độc lập với nhau.Bitrate cung cấp giữa 2 kênh âm thanh thay đổi phù hợp với lượng thông tin được chứa trong mỗi kênh.
    Joint stereo cũng tích hợp 2 kênh âm thanh nhưng có một bước tiến xa hơn vì có thể sử dụng được những mẫu chung thường xuất hiện ở cả 2 kênh.Do đó độ nén sẽ tốt hơn so với stereo bình thường.

  6. wookie - 24-11-2006 07:35 PM
    Định nghĩa
    Advanced Audio Coding (AAC) là một định dạng âm thanh đa năng nén theo kiểu lossy được định nghĩa bởi MPEG-2 tiêu chuẩn và được phát triển bởi sự liên kết của Fraunhofer, Dolby, Sony, AT&T.AAC được phát triển nhằm thay thế cho định dạng âm thanh đã quá nổi tiếng MP3 để tích hợp trong container MP4-một container của MPEG-4 tiêu chuẩn hỗ trợ đầy đủ các tính năng phụ(xem thêm phần MPEG-4).
    AAC có thể tích hợp tới 48 kênh âm thanh (có sample rate tới 96KHz) cộng thêm 15 kênh âm thanh tần số thấp (Low Frequency Enhancement-LFE) giới hạn sample rate ở 120 Hz.

    HE-AAC và LC-AAC

    HE-AAC và LC-AAC là hai profile của MPEG-4 AAC tiêu chuẩn.
    -LC nghĩa là “ít phức tạp”-Low Complexity.
    -HE nghĩa là “hiệu quả cao”-high efficiency.HE-AAC cũng được hiểu theo cách khác là AACPlus,AAC+ hay AAC SBR(Spectral Band Replication)…
    HE-AAC được phát triển nhằm sử dụng trong việc encode với bitrate thấp – đặc biệt có tác dụng với file âm thanh có sử dụng nhiều kênh (multichannel).

    Những công cụ cho việc encode AAC.

    Đối với LC profile:
    -Apple AAC:chỉ hỗ trợ CBR với những bản Quicktime cũ hơn ver7.Từ Quicktime 7 trở đi có thể encode AAC VBR.Mặc dù vậy,đến thời điểm này Quicktime vẫn chưa hỗ trợ multichannel.
    http://www.apple.com/quicktime/download/
    http://www.apple.com/itunes/download/

    -FAAC (Free Advanced Audio Coder):một LC-AAC mã nguồn mở và miễn phí
    http://www.audiocoding.com/
    Dành cho Winamp http://pessoal.onda.com.br/rjamorim/out_faac.zip (nếu sử dụng Winamp pro,có thể chuyển đổi từ đĩa Audio CD sang FAAC)
    Dành cho CoolEdit http://www.rarewares.org/files/case/cool_faac.zip

    LC & HE Profile:

    -Nero Burning rom và trình Wave Editor tích hợp có thể encode cả LC và HE AAC.Plugin có thể download tại http://neroplugins.cd-rw.org/
    -RealPlayer 10 và RealProducer 10.Có thể tìm hiểu tại http://www.real.com/
    Hỗ trợ đầy đủ kỹ thuật mã hóa LC/HE AAC.Với RealPlayer 10 gold,ta có một công cụ mã hóa AAC rất đáng sử dụng.Để encode HE AAC với RealProducer,cần có một gói hỗ trợ có thể tìm thấy tại: https://helix-producer.helixcommunity.org/downloads.htm

    AAC GUI:

    -BeLight
    http://belight.corecodec.org/
    Một GUI (giao diện đồ họa dành cho người sử dụng-Graphic User Interface) có thể encode hầu hết các định dạng âm thanh hiện nay dựa vào việc sử dụng chương trình thực thi BeSweet và các plugin âm thanh.Với BeLight,người dùng được hỗ trợ encode với FAAC,NeroDigitalAAC,WinampAAC,3GP reference.

    -TheAACmachine Guide
    GUI hỗ trợ cho AacEnc.exe 1.15 hay mới hơn
    http://www.doom9.org/AacMachine.htm

    Nếu muốn tìm hiểu thêm thông tin về AAC hay audio,những site sau có thể giúp ích cho bạn.
    http://www.dolby.com/
    http://www.codingtechnologies.com/
    http://www.videohelp.com/glossary

  7. wookie - 24-11-2006 07:36 PM
    Container-tác dụng

    Container có thể hiểu là định dạng dùng để kết hợp các stream đa phương tiện lại thành một thể thống nhất.Nhiều video stream,audio stream,phụ đề hay chapter… được kết hợp trong một file duy nhất với một định dạng nhất địn.Định dạng đó là container.
    Những container được biết đến nhiều nhất hiện nay là:
    AVI (.avi)-Audio Video Interleave.Định dạng dành cho MPEG-4 được sử dụng nhiều nhất trên máy tính cài đặt hệ điều hành Windows.Có thể tích hợp nhiều kênh âm thanh hỗ trợ cho hình ảnh.
    MPEG (.mpg, .mpeg)- Motion Picture Expert Group ,container kết hợp hình ảnh và âm thanh thành một hệ thống,được sử dụng để sản xuất VCD,SVCD hày DVD.
    Matroska (.mkv, .mka).Là container sử dụng cho MPEG-4.Có thể kết hợp hình ảnh với nhiều kênh âm thanh.Cũng có thể tích hợp thêm phụ đề và chapter.
    OGM (.ogm).Container dành cho MPEG-4.Hỗ trợ kết hợp hình ảnh,âm thanh,phụ đề,chapter.
    Quicktime (.mov) và Realmedia (.rm, .rmvb).
    Div.divx).Container mới do DivXNetworks công bố.Tích hợp hầu như đầy đủ tính năng như một DVD: video, multiple audio, subtitlestreams,Menu,chapter.Hơn nữa,tất cả những tính năng này rất dễ tạo ra với phần mềm đi kèm của chính hãng là DivXconverter.

    MP4 container.
    Là container chính thức được dùng để hỗ trợ cho MPEG-4 tiêu chuẩn.Còn được hiểu là ISO 14496-14.
    MP4 hỗ trợ tất cả những loại stream thông dụng như video, multiple audio, subtitlestreams, pictures, variable-framerates… và những nội dung tiên tiến khác như đồ họa động 2D,3D,chapter,menu(như DVD menu)…
    Các dạng mở rộng của MP4
    .mp4: dùng cho việc kết hợp các thành phần cần thiết của file movie.
    .m4a:được đưa ra bởi Apple,dùng cho file âm thanh AAC.
    .m4e:được đổi phần mở rộng từ .sdp cho streaming của Envivio.
    .m4p: DRM(Digital Rights Management) của Apple được áp dụng trong định dạng mở rộng này để bảo vệ file.Xem thêm thông tin về DRM tại www.afterdawn.com\glossary
    .m4v,mp4v:định dạng chỉ dành cho video thuần-chưa qua kết hợp(RAW),nó giống như định dạng m1v,m2v khi liên hệ với MPEG-1/2.
    3gp, .3g2:sử dụng trên điện thoại di động.

    Để tìm hiểu thêm vể MP4,dưới đây là một số địa chỉ cho bạn:
    http://mediaxw.sourceforge.net/files...4%20System.pdf
    http://www.mp4ra.org/atoms.html
    http://www.chiariglione.org/mpeg/faq...ys/mp4-sys.htm

  8. wookie - 24-11-2006 07:39 PM
    Chọn CPU nào cho việc mã hóa các tập tin đa phương tiện.



    Hiện nay để lựa chọn một bộ vi xử lý cho máy tính để bàn ở Việt Nam,hầu như chỉ có hai lựa chọn cho người mua:dùng CPU của Intel hay AMD(Advanced Micro Devices).Vậy câu hỏi đặt ra ở đây là CPU của hãng nào tốt hơn trong việc encode các tập tin đa phương tiện.Chúng ta hãy cùng xem xét.

    Trước đây,không một ai có thể phủ nhận việc CPU do Intel sản xuất luôn đạt được một tốc độ encode rất tuyệt vời so với AMD.Chỉ cần kết nối Internet và vào một vài trang web chuyên về lĩnh vực thử nghiệm phần cứng,bạn sẽ dễ dàng bắt gặp ngay sự tỏa sáng của Pentium 4 trong lĩnh vực encode đầy hấp dẫn này.Vì vậy,thật dễ hiểu khi Intel thường được mọi người nghĩ tới trước tiên khi nhắc đến CPU dành cho mã hóa tập tin đa phương tiện.Bạn hãy tham khảo một vài benchmark để thấy rõ Intel tỏa sáng như thế nào:

    bench1

    Trong thử nghiệm trên,ta thấy rõ ưu thế tuyệt đối của Pentium4 D 2.8(820) đối với A64 3500+.Ngay cả Pentium 630 với xung nhịp chỉ 3.0Ghz cũng vượt qua A64 3500+ một chút trong cuộc đua này và chỉ kém trong thử nhiệm với XviD.Thậm chí ngay cả khi bạn thay 3500+ thành 3800+ thì kết quả cũng không khả quan hơn là bao.
    Số tiền phải chi cho CPU 820 là nhiều hơn khoảng từ 20 cho tới 50 $ so với 3500+ tùy từng loại.Số tiền phải chi cho 3500+ lại nhiều hơn 630 từ khoảng 30 tới 50$.Kết quả này cho thấy nếu chỉ để ý đến nhu cầu encode thì mua Intel 630 là kinh tế hơn so với A64 3500+ .
    Mời bạn xem tiếp bảng liệt kê sau:Một benchmark thông qua encode DVD sang XviD1.0

    XviDtime

    Trong bảng này,ta thấy vị thế của Intel là rất lớn và AMD phải chịu lép vế khi ngay cả quái vật FX55 còn kém CPU dẫn đầu của Intel xa lắc trong khí giá đắt hơn rất nhiều.


    Vậy qua các bảng đánh giá trên,chúng ta kết luận nên luôn luôn dùng Intel để encode,sẽ có lợi hơn AMD ? Xin mời bạn tham khảo tiếp những thử nghiệm sau:

    bench2

    Để bạn dễ dàng liên tưởng tương quan số tiền phải chi cho các CPU trong thử nghiệm trên,tôi sẽ liệt kê giá của chúng theo bảng giá mới nhất của Newegg khi tôi viết bài này:
    Athlon 64 3500+ 2.2GHz Venice 201$
    Athlon 64 3800+ 2.4Ghz Venice 282$
    Athlon 64 4000+ 2.6Ghz SanDiego 334$
    Athlon 64x2 4200+ 2.2Ghz Manchester (dual core) 400$
    Pentium D 840 3.2Ghz Smithfield (dual core) 536$
    Athlon 64x2 4800+ 2.4Ghz Toledo (dual core) 790$
    Athlon 64 FX55 2.6Ghz SanDiego 811$
    Pentium EE 840 3.2Ghz Smithfield (dual core) 1040$

    Như bạn thấy trong bảng đánh giá thứ ba này,đứng đầu luôn là 2 CPU của AMD,đặc biệt là 2 CPU A64X2.Tại sao lại có kết quả ngạc nhiên như vậy,nhất là khi ta vừa chứng kiến sự ấn tượng của CPU Intel trong 2 bảng so sánh đầu tiên.
    Một phần chủ yếu nguyên nhân dẫn đến sự đuối sức của các CPU Intel so với AMD thế hệ mới trong lĩnh vực này có thể giải thích một cách rất đơn giản.Trên nền móng hiện nay của Intel,sự giới hạn về băng thông (bandwidth) là một vấn đề lớn.Trái ngược lại với AMD,công nghệ Hypertransport mang tới cho hệ thống này khả năng truyền dữ liệu trên một băng thông rộng lớn hơn rất nhiều so với Intel.Và vào thời điểm này,khi mà cuộc đua đẩy xung nhịp của CPU lên cao đã gần như đến hồi kết thúc và chuyển sang dòng sản phẩm Chip đa lõi-đa ứng dụng,thế mạnh về băng thông của AMD đang được phát huy hơn bao giờ hết.AMD càng tận dụng hơn nữa lợi thế về băng thông khi kết hợp với chip đa lõi và đang chứng minh được rằng encoding multimedia sẽ trở thành một thế mạnh mới ở dòng CPU của họ.

    Bạn hãy tham khảo thêm một bảng đánh giá nữa dựa trên sự so sánh giá cả/hiệu năng để tự tìm cho mình lựa chọn hợp lý

    MediaEncoding P F

    Kết luận:
    Cả Intel và AMD đều đưa ra hai bộ mặt,vừa hào nhoáng,vừa ủ dột trong trận chiến về performance trong mã hóa các tập tin đa phương tiện.Cả hai đều có những khoảng không gian để có thể thể hiện ưu thế của mình và một khoảng không khác để phô bày ra sự yếu kém.
    Nếu bạn định mua một CPU lõi đơn mới và đặt mục đích encode lên hàng đầu,Intel có vẻ là giải pháp sáng suốt hơn nếu so sánh với AMD lõi đơn.
    Nếu muốn sử dụng chip đa lõi-chắc chắn bạn không thể có lựa chọn tốt hơn là một A64X2.Tại thời điểm tôi viết bài này,A64X2 4800+ đang được coi là một con quái vật trong việc encode dù giá của nó không phải thuộc hàng đắt nhất.Và cũng trong giai đoạn này,AMD đang tiến hành giảm giá các sản phẩm CPU của mình,nếu định mua một PentiumD,có lẽ bạn nên cân nhắc lại khả năng sẽ mua một A64X2 3800+ (giá ở Newegg trong khoảng 330-340$),đây sẽ là một sự lựa chọn tuyệt vời.

    Outdated now

  9. wookie - 24-11-2006 07:42 PM
    DirectVobSub là một công cụ hiển thị phụ đề người xem film nén trên máy tính có thể sử dụng tính năng subtitle y như khi xem phim trên đĩa DVD.DirectVobSub có tính tương thích cao-hỗ trợ hầu như toàn bộ các định dạng phụ đề thông dụng hiện nay(bao gồm cả image và character) cũng như các phần mềm playback video(WindowsMediaPlayer,powerDVD,Winamp,...).Kể từ khi việc xem film nén(video dạng MPEG4) trên máy tính là một tác vụ thường xuyên,DirectVobSub là một phần mềm không thể thiếu trong danh mục các phần mềm đầu tiên cài vào máy tính.

    Download directvobsub

    Các tính năng nổi bật của DirectVobSub:


    1.Tách phụ đề trực tiếp từ đĩa DVD.
    Đây là tính năng giúp mã hóa phụ đề trong đĩa film DVD thành dạng ảnh(image),lưu lại với định dạng mặc định của DirectVobSub.
    Tìm đến thư mục của DirectVobSub trên nút start,chọn Vobsub configure.Khi cửa sổ hiện ra,nhấn open,tìm đến thư mục VIDEO_TS của đĩa DVD muốn thao tác,chọn file có dạng VTS_XX_X.IFO,chọn đường dẫn tới thư mục muốn lưu kết quả rồi nhấn OK.Cửa sổ selectPGC hiện ra với bảng liệt kê đầy đủ các phụ đề có mặt trên đĩa.Nếu lấy hết phụ đề,bạn để nguyên như vậy rồi nhấn OK.Nếu muốn loại bỏ phần nào đó,chọn nó rồi nhấn "<--".Quá trình index sẽ mất vài phút.
    Lưu ý là trong hầu hết trường hợp,không nên tác động tới phần vob/cell id,nếu bỏ đi một phần vob cell nào đó,bạn đã căt đi mất một phần phụ đề ứng với vob cell đó.Chỉ làm việc này khi bạn có nhu cầu với từng phần riêng lẻ của bộ film.
    Sau khi hoàn thành,bạn sẽ thu được 2 file có dạng
    VTS_XX_X.sub : có dung lượng lớn,khoảng vài MB cho một ngôn ngữ,nếu có 3 ngôn ngữ khác nhau,chắc chắn độ lớn sẽ không dưới 10MB.
    VTS_XX_X.idx : một file thông tin nhỏ (khoảng vài trăm KB là cùng) để lưu thông tin và giúp truy xuất image từ file sub lớn ở trên.
    Bây giờ dùng Winrar nén file sub lớn lại,sau đó bạn có thể xóa file sub này đi mà không phải bận tâm.Winrar sẽ nén file này với tỷ lệ nén còn khoảng 20%(việc này sẽ rất có ích vì tiết kiệm được tới 80% dung lượng cho phụ đề).
    Đổi tên của file RAR và idx giống với file video đi kèm và đưa 3 file đó vào chung một thư mục,ví dụ:
    movie.AVI
    movie.idx
    movie.RAR
    Từ bây giờ,mỗi lần dùng một phần mềm playback video nào đó hỗ trợ DirectVobSub,phụ đề sẽ tự động nạp cùng với film.

    2.Biên tập,chuyển đổi phụ đề.
    Subresync là một công cụ để chuyển đồi qua lại giữa các tập tin phụ đề mà DirectVobSub hỗ trợ.Thứ chúng ta cần nhất ở công cụ này là việc nó có thể chuyển phụ đề được lưu dưới dạng image(graphic sub) của mặc định idx thành dạng phụ để character(text sub),điểm mạnh của phụ đề dạng này là rất nhỏ và dễ chỉnh sửa nội dung(vì nó được lưu dưới dạng chữ).
    Để gõ được tiếng Việt,bạn cần thêm một bộ gõ,và theo tôi thấy,dùng Unikey là tốt nhất.

    Kích hoạt công cụ Subresync.Chọn file idx của phụ đề cần chuyển đổi,trước đó hãy chọn chính xác Fps của video kèm theo(để xem Fps của một file video bạn có thể dùng công cụ miễn phí Gspot)
    Tiếp đến,chọn ngôn ngữ muốn chuyển đổi,nhấn save as.
    Với các định dạng mà Subresync có thể chuyển đổi,các dạng sau đây vẫn lưu dưới dạng ảnh:
    -DVDMaestro *son
    -Scenarist *sst
    -WinSubMux *sub
    -Chính định dạng cũ idx/sub
    Còn các tùy chọn còn lại đều xuất ra dạng text.Bạn có thể chọn định dạng nào phù hợp với nhu cầu sử dụng sau này,ở đây tôi chọn *srt(mặc định của Subrip).Nếu ngôn ngữ bạn định capture không phải là tiếng Anh hoặc có những ký tự không thuộc bảng mã ANSI,bạn phải chắc chắn mình đã đánh dấu chọn unicode output.
    khi nhấn save as,một cửa sổ mới hiện ra yêu cầu bạn gõ những chữ hiện ra,bạn chỉ việc gõ y như nó yêu cầu(đừng sợ-không phải gõ toàn bộ từ đầu đến cuối đâu),mục đích là đề gán mỗi image với một letter tương ứng.Khi nhận đủ mặt chữ xuất hiện trong phụ đề,bạn sẽ không phải gõ nữa,quá trình chuyển đổi hoàn thành.

    3.Cắt và ghép,mux phụ đề.

    a.Cắt
    Có những trường hợp người sử dụng muốn ghi đĩa,nhưng file video phải cắt ra 2 phần bởi giới hạn dung lượng đĩa trong khi phụ đề chỉ có một phần,như vậy nhất định ta cũng phải cắt file phụ đề ra tương ứng với file video đã cắt.Các bước rất đơn giản với Sub File Cutter.
    Chắc chắn lúc cắt file video,bạn biết mình đã cắt nó ở đoạn nào.Ví dụ,tôi cắt film có độ dài 1 giờ 22 phút 58 giây 920 thành 2 phần có độ dài là:
    phần 1: từ đầu đến phút thứ 45
    phần 2:từ phút thứ 45 đến 82'58''920
    Vậy muốn tạo sub cho đoạn 1 ta cần nhập thời gian như sau:ở ô start,giá trị sẽ là 0 (đơn vị trong các ô lần lượt là giờ-phút-giây-phần nghìn giây) và ở ô end là 0-45-00-000.
    Với sib cho phần 2 làm tuơng tự,đặt start là 0-45-00-000 và end là thời gian kết thúc.Ở phần 2,nhớ đánh dấu vào ô"modify timestamps to count from start",nếu không,phần sub thứ hai sẽ chỉ phát khi video thứ 2 chạy qua 45' (!)

    b.Ghép
    Khi đã hiểu về cắt rồi,quá trình ghép cũng tương tự.
    Tiếp tục với ví dụ trên,khi đã có 2 file sub được cắt,bây giờ ta lại muốn ghép chúng lại.Đầu tiên nhập 2 file cần ghép vào theo thứ tự 1-2.Sau đó thêm thời gian file input 2 bắt đầu-chính là thời gian kết thúc của file video thứ nhất(45').

    c.Mux
    Cách dùng SubMux thực sự đơn giản,chỉ là kéo thả rồi click.Những định dạng được hỗ trợ là AVI,ogm,wma,ogg và 2 định dạng textsub là ssa và srt.
    Kéo và thả các file cần mux vào cửa sổ SubMux,rồi click MUX bạn sẽ thu được một file AVI có đủ các thành phần vừa nhập vào.Khi đó,file phụ đề(nếu có) đã được tích hợp trong file movie của bạn,và mỗi lần mở nó,chắc chắn phụ đề sẽ được load(tất nhiên là với điều kiện máy đã cài DirectVobSub và phần mềm playback tương thích)
    Nhưng điểm yếu chí mạng của cách mux phụ đề thẳng vào file AVI này là không thể cùng lúc với việc mux mp3,khi file avi đã có mp3,nó không thể mux sub,còn nếu đã mux sub sau đó mux mp3,file sub đã mux sẽ bị đè lên và bị xóa mất.

    4.Hiển thị phụ đề.
    DirectVobSub autoloading version 2.23 sẽ tự động load phụ đề và hiển thị chúng khi bạn chạy movie trong 2 trường hợp sau:
    -Tập tin phụ đề và video cùng tên đặt chung một thư mục.
    -Tập tin phụ đề đã được mux chung với movie.
    Ngoài 2 trường hợp này,nếu muốn dùng một phụ đề bất kỳ nào khác,bạn phải đích thân nhập đường dẫn chính xác đến nơi có chứa phụ đề đó bằng cách mở DirectVobSub configure/main/open....
    -Đối với textsub,khi sử dụng nhiều file cho nhiều ngôn ngữ khác nhau,cách đặt tên như sau:
    movie.AVI
    movie.English.srt
    movie.France.sub
    movie.Vietnamese.ssa

    ....

    Nếu không muốn sắp xếp thứ tự file sub trên menu load theo bảng chữ cái,có thể đặt tên như sau
    movie.AVI
    movie.00.Vietnamese
    movie.01.English
    movie.02.France
    khi ấy,số nào nhỏ hơn sẽ đứng trước.

    Thay đổi cách hiển thị phụ đề trong DirectVobSub configure.
    Tab Main:
    -Cho phép điều chỉnh vị trí hiện sub.
    -Cho phép chỉnh màu cho sub
    -cho phép thay đổi font chữ cho sub(không áp dụng cho graphic sub)
    -Một vài lựa chọn nhỏ khác.
    Tab Timming
    Trong trường hợp sub bị lệch so với movie do thời gian nhanh hơn(hay chậm hơn),lỡ set sai Fps,tab này có thể là một lựa chọn để chỉnh sub lại đồng bộ với movie.
    Delay:Cộng thêm một giá trị thời gian dương bằng với khoảng thời gian sub chậm hơn movie khoảng thời gian đó và cộng một giá trị thời gian âm cho sub nhanh hơn movie.Để dùng cách này hãy đánh dấu một đoạn bắt đầu hiện sub trên movie,ghi nhớ thời gian lại,sau đó tìm đoạn sub đó trên file sub với thời gian tương ứng của nó,so sánh 2 giá trị.(đơn vị 1/1000 giây)
    Nếu set delay vẫn không giải quyết được vấn đề,hãy thử set Fps hay ratio sub/video.Với 3 phương pháp này,chắc chắn lỗi lệch sub sẽ được khắc phục.
    Các Tab còn lại khá dễ hiểu và nói chung là không cần chỉnh sửa nhiều.

  10. wookie - 24-11-2006 07:50 PM
    Công cụ cần thiết:
    Vobsub 2.23 Download directvobsub
    VirtualDub
    File video
    File phụ đề dạng text hay mặc định của VobSub.


    Chuẩn bị.
    Cài đặt VirtualDub
    Cài đặt Vobsub 2.23
    Trong quá trình cài đặt,chọn Custom/Plugin,đánh dấu vào VobSub for VirtualDub và TextSub for VirtualDub and Avisynth.

    installvobsub

    Khi được yêu cầu,hãy chỉ đường dẫn đến thư mục vừa cài VirtualDub
    Nhấn next cho quá trình cài đặt tiếp tục đến khi hoàn thành.

    Convert

    Mở VirtualDub,chọn file video cần convert.

    Trên thanh công cụ:
    -chọn Video/Full Processing mode
    -chọn Audio/Direct Stream copy.

    fullprocessing DirectStream

    -Dùng tổ hợp phím Ctrl+P để mở cửa sổ Compression,chọn codec mà bạn quen thuộc,configure theo ý muốn rồi chọn OK(nếu bạn chưa bao giờ sử dụng mpeg4 codec,hãy đọc các guide trước để tìm hiểu thêm)

    codecselect

    Bây giờ là lúc quyết định để chuyển phụ đề thành dạng tín hiệu hình ảnh:
    Trên thanh công cụ,chọn Video/Filter/Add
    một danh sách những bộ lọc dành cho VirtualDub hiện ra.

    Filter

    Nếu bạn có một phụ đề lưu dưới dạng text(đuôi mở rộng là srt,sub,psb,smi,ssa,ass),hãy chọn TextSub 2.23.
    Khi cửa sổ TextSub hiện ra,nhập đường dẫn tới file phụ đề dạng text của bạn.
    Chọn Styles... nếu có ý định chỉnh sửa màu,cỡ chữ,font... cho phụ đề.

    textsubset

    Lưu ý,nếu phụ đề tiếng Việt hay bất cứ phụ đề nào sử dụng font hỗ trợ Unicode,bạn phải những font chữ cũng phải hỗ trợ Unicode(ví dụ như Verdana),nếu không phụ đề sẽ không hiển thị đúng.

    Nếu bạn đang dùng phụ đề dạng hình ảnh của VobSub(xem bài hướng dẫn về VobSub để rõ hơn),chọn VobSub 2.23.Dùng Open để mở file idx/sub bạn có,sau đó chọn OK.

    Chọn OK cho tới khi quay trở lại cửa sổ chính của VirtualDub.
    Dùng tổ hợp phím Ctrl+F7 để tiến hành convert.

    Cuối cùng,những ký tự trong file phụ đề được VobSub tự động nạp song song với việc encode video và VirtualDub sẽ coi phần phụ đề đó như tín hiệu video bình thường.Bạn sẽ thu được một file video mpeg4(dạng avi) với phụ đề permanent.

    kết quả:
    Image 0000

  11. wookie - 24-11-2006 07:58 PM
    Những phần mềm cần thiết:
    -VirtualDub MPEG-2 1.6.11
    -FFDshow

    Sau khi download,giải nén và đưa tất cả file cần thiết của VirtualDub MPEG-2 1.6.11 vào một thư mục.Ghi nhớ đường dẫn của nó.
    Cài đặt FFDshow.Trong quá trình cài đặt,sẽ có một cửa sổ chọn đối tượng muốn sử dụng.Khi ấy đánh dấu chọn

    VDplugin
    VirtualDub trong phần Applications plugins

    Tiếp tục cài đặt bình thường cho đến lúc trình cài đặt cần nhập đường dẫn đến thư mục plugins của VirtualDub,hãy chỉ đường dẫn tới phần plugins của VirtualDub MPEG-2 1.6.11 vừa giải nén.

    path

    Tiếp tục cài đặt bình thường.

    Sau khi cài đặt hoàn tất,kích hoạt VirtualDub MPEG-2 1.6.11.
    Chọn Video/Compression…(hay đơn giản dùng tổ hợp Ctrl+P)
    compression

    Khi cửa sổ Compression xuất hiện,tìm và chọn dòng ffdshow Video Codec(đã được cài ở bước trước).
    ffdshowvideocodec

    Trong cửa sổ mới của ffdshow,chọn Tab Decoder,chọn Codecs.
    Trong cửa sổ codec bên phải,tìm tới dòng WMV và chọn decoder cho định dạng này(lúc này theo mặc định,ffdshow không decode bất cứ file WMV nào)
    wmvffdshowdecoder

    Chọn OK cho tới khi quay trở lại cửa sổ chính của VirtualDub MPEG-2 1.6.11.

    Bây giờ là lúc nhập file WMV input,nếu các bước trên là đúng, VirtualDub MPEG-2 1.6.11 sẽ có khả năng thao tác với định dạng WMV.
    đây là hình ví dụ:
    sample

    Chọn Video/Compression…
    compression

    Chọn codec bạn muốn sử dụng cho file video sẽ xuất ra,configure cho nó.

    Chọn Audio/Compression.
    Chọn audio codec bạn muốn dùng,chọn profile.
    selectaudiocompression

    Khi vừa ý,chọn OK.

    Cuối cùng nhấn F7 để chọn đường dẫn tới nơi muốn lưu file xuất.Quá trình encode sẽ bắt đầu và ta sẽ thu được một file avi.

  12. wookie - 24-11-2006 08:00 PM
    Bạn đã từng xem VCD? Hẳn bạn đã gặp những VCD có hiện phụ đề như một phần của tín hiệu video.
    Bây giờ,bạn có một bộ phim theo định dạng Avi,mpg,asf,d2v…,một tập tin phụ đề(srt,sub,smi…) lấy được từ đâu đó,bạn muốn ghi phim ra đĩa CD và có phụ đề y như những gì bạn đã được xem…sau đây tôi sẽ trình bày cách đơn giản nhất để làm việc đó.

    Chuẩn bị:

    Một module dùng để hiện phụ đề(srt,sub,smi,idx,…)
    Có thể là Directvobsub hay ffdshow (đây là hai phần mềm miễn phí có thể dễ dàng tìm thấy tại _www.doom9.org)
    TMPGEnc plus (có thể tìm thấy trên www.updatesofts.com)
    Một phần mềm dùng để ghi đĩa hình VCD.Ở đây tôi sử dụng Ahead Nero

    Cách thực hiện:

    -Cài đặt những phần mềm đã chuẩn bị ở trên.
    -Cách cấu hình các phần mềm.
    Đưa tập tin phụ đề và hình ảnh vào cùng một thư mục.Đặt tên các tập tin này giống hệt nhau


    +Nếu bạn dùng Directvobsub,chương trình này sẽ tự động tìm ra những phụ đề hợp lệ và load cho bạn.
    +Nếu ban dùng ffdshow,hãy vào phần Video decoder configuration trên start/program/ffdshow.Khi cửa sổ configuration hiện ra,đánh dấu vào phần Subtitles.

    Nếu như các thiết lập này chuẩn xác,khi chơi thử tập tin video đó bằng 1 chương trình xem phim(ví dụ như windows media player),ta sẽ thấy có phụ đề hiện ra rõ ràng,kèm theo một đấu mũi tên màu xanh ở trên system tray.

    +Cấu hình cho TMPGEnc plus:

    Trên thanh công cụ,chọn option/Environmental Setting.
    Chọn tab VFAPI plugin
    Đánh dấu chọn Directshow Multimedia File Reader,đặt priority của plugin này cao nhất.
    Nhấn OK để hoàn thành thiết lập.

    -Tiến hành encode.
    Với TMPGEnc plus,tập tin video xuất ra có thể là MPEG1(VCD) hay MPEG2(SVCD,DVD),nhưng trong trường hợp này ta sẽ chọn là mpeg để đạt được mục đích ban đầu.Nếu là mpeg2,định dạng có thể thêm phụ đề có thể chyển đổi được(switchable sub),ta không nên mux luôn phụ đề thành tín hiệu như VCD.
    Có hai cách chọn tập tin video nhập:
    Kéo thả tập tin cần convert,sau đó nhấn Setting ở bên dưới để chọn.
    Dùng Project Wizard(Ctrl+W).
    Chọn File/Preview để kiểm tra lần cuối.Nếu thấy phụ đề đã hiện đúng,lúc đó tất cả đã sẵn sàng convert.
    ---------------------------------------------------------------------------------------------------------------------------
    Lưu ý quan trọng:
    Thực tế trong quá trình convert với bản TMPGEnc plus 2.511.51.160(bản từ năm 2003),tôi gặp phải tình trạng nếu set priority của Directshow Multimedia File Reader lên cao nhất,tập tin xuất sẽ không thể hoàn thành chuẩn xác việc xử lý âm thanh đi kèm với tập tin video input.Gặp phải tình trạng đó,ta sẽ thu được một tập tin mới chỉ phát hình mà không có tiếng trong khi kết cấu vẫn bao gồm một tập tin âm thanh(âm thanh đã bị hỏng không nghe thấy).Lý do là set priority của Directshow Multimedia cao nhất sẽ làm cho TMPGEnc plus quên mất tiến trình đúng đắn dùng để thao tác với âm thanh.
    Nếu bạn gặp phải tình trạng đó,đây là cách khắc phục.
    Đầu tiên vẫn để các thiết lập như hướng dẫn,sau đó dùng phương pháp kéo thả tập tin video cần convert vào cửa sổ làm việc của TMPGEnc plus.Mục đích của cách này là enable Stream type bị vô hiệu hoá ở phương pháp Project Wizard.
    Trong ô stream type ở góc dưới cửa sổ,chọn ES-video only.
    Vậy là khi convert,chương trình sẽ loại bỏ giai đoạn xử lý âm thanh do đó tiết kiệm thời gian hơn.
    Khi hoàn thành ta thu được một tập tin video với phần mở rộng là m1v(m2v nếu là định dạng cho DVD).lúc này tập tin m1v đã mux phụ đề nhưng không có âm thanh.
    Bây giờ là lúc xử lý âm thanh.Hãy truy cập trở lại vào Environmental Setting,giảm priority xuống(bằng hoặc thấp hơn các plugin khác).Như vậy âm thanh sẽ được xử lý bình thường.Quay trở ra phần stream type,đánh dấu vào ES-audio only,nhấn vào setting ở phía dưới,chọn audio xuất là mpeg1-audio layer 2,nhấn Start để convert nó.Ta sẽ thu được một tập tin âm thanh có đuôi mp2.

    Ghép tập tin âm thanh và tập tin hình ảnh với nhau:trên thanh công cụ,chọn File/MPEG tools.
    Dừng lại ở tab đầu tiên-Simple Multiplex,chọn loại type MPEG muốn chi ra đĩa(ở đây chúng ta đang muốn có MPEG1).
    Chọn tập tin m1v và mp2 vừa thu được ở phần video input và audio input.
    Chọn đường dẫn cuối cùng cho tập tin output.
    Nhấn Run.Vì đây là chế độ direct copy nên thời gian để ghép hình và tiếng lại với nhau là không đáng kể(xấp xỉ thời gian coppy một tập tin có cùng dung lượng)
    Ta sẽ thu được tập tin mpeg1 có đủ cả hình,tiếng,và phụ đề đã mux.


    Ghi đĩa:
    Nếu tập tin mpeg xuất ra lớn hơn dung lượng mà đĩa CD có thể lưu trữ,bạn phải cắt nó ra(giống như các đĩa VCD thường có 2, hay 3 đĩa).Vẫn trong phần MPEG tools vừa nêu,chọn tab Merge&Cut,đây là công cụ dùng để cắt ghép các tập tin mpeg thành các phần lớn nhỏ như ý muốn.Nếu ghi ra CD,bạn nên cắt thành các tập tin lớn vừa phải để hạn chế việc hỏng tín hiệu video trên đĩa.Ví dụ tập tin có dung lượng 1000MB,nên cắt thành 2 tập tin 500MB để ghi trên 2 đĩa,đừng cắt một phần 700MB,một phần 300MB.
    Dùng Nero tạo ảnh cho các đĩa CD sẽ ghi.
    Cuối cùng là xoá phân mảng cho file ảnh,chuẩn bị đĩa trắng và burn nó.


    PDF document:_http://rapidshare.de/files/11147557/denise_VCDsub_nosec.rar.html

  13. wookie - 24-11-2006 08:23 PM
    Bài viết này được thực hiện với XviD 1.1.0 beta 2 và VirtualDub 1.6.11(build 23774).Bạn có thể thay VirtualDub bằng bất cứ chương trình “convert video to mpeg4” nào cho phép chọn codec (nhưng tôi khuyên bạn nên dùng VirtualDub hay VirtualDubMod để có thể tự do chỉnh sửa).

    Muốn dùng codec cho VirtualDub,trên thanh công cụ của VirtualDub chọn video.
    Chọn một trong 3 mức compress:
    -Fast recompress
    -Normal recompress
    -Full processing mode
    (không chọn Direct stream copy)

    Chọn Compression(Ctrl+P)
    Chọn XviD mpeg4 codec

    Click vào configure ở bên phải

    Cửa sổ XviD Configuration hiện ra với rất nhiều tùy chọn.Có thể nói,XviD là codec cho phép tinh chỉnh rất nhiều tới phương thức làm việc với hình ảnh.Nếu bạn mới dùng codec này có thể sẽ thấy hơi hoang mang không bỉết nên làm như thế nào,nhưng nếu đã sử dụng quen bạn sẽ thấy những tinh chỉnh đó thật tuyệt vời.Bây giờ ta sẽ xem xét cụ thể.
    main

    Profile @ Level
    Đây là phần tùy chọn profile khác nhau dùng để compress.Mỗi profile lại có các level khác nhau(@ có nghĩa là at),cơ bản là level cao sẽ ít bị giới hạn chức năng hơn so với level thấp hơn nó ở cùng profile.Tuy nhiên cần lưu ý là càng nhiều tính năng được sử dụng sẽ càng làm giảm sự tương thích của file video xuất ra với những thiết bị hỗ trợ mpeg4(ví dụ như đầu đĩa DVD tích hợp giải mã mpeg4 XviD)

    Simple @ level 0,1,2,3 là những profile bị giới hạn hầu như toàn bộ mọi tính năng,hỗ trợ bitrate tối đa là 384kbit/s và độ phân giải tối đa chiều ngang là 352(chiều dọc sẽ tương ứng theo tỷ lệ khung hình).Như vậy,chất lượng thu được sẽ là thấp,nhưng độ tương thích rất cao-profile này thích hợp để tạo ra những movie dùng trên các thiết bị cầm tay hay tương tự.
    ARTS @ 1,2,3,4 –ARTS là viết tắt của Advanced Real Time Streaming.So với simple profile thì không có thêm tính năng nào (ngọai trừ tùy chọn reduced resolution).Cũng giới hạn chiều ngang khung hình là 352 nhưng bitrate tối đa có thể đạt được lên tới 2 mbit/s.

    AS @ 1,2,3,4,5 –AS là viết tắt của Advanced Simple.Ở profile này,XviD sẽ unlock hầu như toàn bộ các công cụ mpeg4 của nó(ngọai trừ tùy chọn reduced resolution),và người dùng có thể tác động sâu tới quá trình nén.Các công cụ ở đây bao gồmb B-frame config,Qpel,GMC và đặc biệt cho phép lựa chọn quantization type.AS đạt tới độ phân giải 720x576x30(frame) ở bitrate cao 8 mbit/s(so sánh với bitrate tối đa cho DVD chuẩn là 9,8 mbit/s)

    DXN-profile này được cho là tương đương với các cấp độ của DivX Certified-là profile chuẩn để chắc chắn rằng file xuất ra sẽ tương thích với các thiết bị phát hình hỗ trợ giải mpeg4(ví dụ như đầu DVD mpeg-4,máy chơi mpeg4 cầm tay,điện thoại di động hỗ trợ mpeg-4…)

    Unrestricted – đúng như tên gọi-profile này không có bất kỳ 1 giới hạn nào cả.Và những file được convert ở profile này không được đảm bảo là sẽ tương thích với các thiết bị chơi mpeg4 chuyên dụng.

    Tóm lại,khi chọn profile bạn nên nhớ rằng:mức profile càng cao,càng sử dụng được nhiều công cụ hơn,chất lượng thu được càng tốt,độ tương thích với thiết bị chuyên dụng càng kém.Cho nhu cầu nén phim DVD ra đĩa CD,tôi khuyên bạn nên chọn AS @ L5 cho nhu cầu nén film hàng ngày.

    Profile
    Chọn more… cửa sổ chi tiết về profile hiện ra.
    profile

    Quantization type,chọn H.263 nếu bạn có ý định nén một bộ phim có độ dài trung bình vào 1 CD 700 MB (có nghĩa là H.263 nếu bitrate cho file video xuất ra nhỏ hơn 1000 kbit/s),chọn MPEG nếu muốn xuất ra hai CD(đối với tôi là khoảng trên 1500 kbit/s).MPEG-Custom sẽ cho phép bạn tạo riêng ma trận quantilization cho video của mình,hoặc bạn cũng có thể sử dụng các ma trận được soạn sẵn cho từng trường hợp-các ma trận loại này có thể download tại các forum XviD như http://forum.doom9.org - XviD forum.Một ma trận thích hợp có thể cải thiện chất lượng file xuất ra tới hàng chục phần trăm so với ma trận mặc định.

    Adaptive quantization(còn được biết đến như là lumi-masking)-bình thường,có những phần thông tin mà mắt người thường hay để ý hơn,đó là do tâm lý chú ý về một số điểm nhất định trong khung hình của con người và những phần đó sẽ cần phải có chất lượng đủ tốt để đáp ứng sự chú ý đó.Ví dụ như trong một cảnh quay có những khu vực nhất định rất tối,thường thì lúc đó,phần tối sẽ được mắt người nhìn nhận là màu đen tương đối(trong khi thực tế ở đó vẫn đầy đủ chi tiết) và vì mắt người quy cho phần đó là màu đen nên thực sự không cần thiết phải xử lý và lưu lại những chi tiết đó mà đơn giản chỉ cần gán cho cả khu vực đó một màu tối  tiết kiệm được bitrate cho phần đó.XviD có khả năng sử dụng những quantizer khác nhau cho mỗi macroblock-hay dễ hiểu hơn là 16x16 block (tính năng mà DivX không có).Khi gặp những phần quá tối hoặc quá sáng,adaptive quantization(lumi-masking) sẽ nén những phần đó với tỷ lệ nén cao hơn các phần có màu bình thường mà mắt người dễ nhận biết hơn.Và bởi vì có những chi tiết đã được nén mạnh nên một số lượng bitrate sẽ được tiết kiệm và dành cho các phần hình ảnh khác,do đó chất lượng video thu được ở những phần mà người xem hay chú ý là cao hơn.
    Mặc dù vậy,đôi khi những phần mất chi tiết đó sẽ làm cho việc theo dõi hình ảnh trở nên khó khăn(khó chịu?!) hơn và làm mất đi những chi tiết quan trọng(không phải phần hình ảnh quá tối hay quá sáng nào cũng là “đồ bỏ”).Vì vậy tùy chọn này là không nên đối với những video có bitrate cao(khoảng trên 1500 kbit/s).

    Interlaced Encoding Nếu file video xuất ra được chọn là dạng interlace thì check vào ô này sẽ cải thiện hiệu năng trong quá trình encode.

    Quarter pixel(qpel) được biết đến là như là “quarter pixel motion estimation”-một nâng cấp của “motion estimation”.Tính năng này giúp đánh giá chuyển động chính xác hơn(trên ¼ pixel thay vì 1 pixel)và đặc biệt có tác dụng với hình ảnh ở độ phân giải thấp.Chỉ một số thiết bị chơi mpeg4 có hỗ trợ qpel.

    Global Motion Compensation(GMC)-giúp cho hình ảnh thể hiện tốt hơn khi tạm dừng và quan sát gần cũng như có khả năng cải thiện chất lượng hình ảnh nếu tỷ lệ khung hình được định dạng kích cỡ quá chênh lệch so với tỉ lệ khung hình gốc.Có vẻ như tính năng này rất ít khi được sử dụng(ngay cả tôi cũng vậy).Hiện tại tôi chưa biết loại thiết bị nào có thể chơi được mpeg4 sử dụng GMC,một khi bạn đã check vào nó,hãy tin tôi đi,hầu như chắc chắn bạn sẽ encode ra một file mpeg4 không thể chạy được ở bất kỳ thiết bị nào ngoài chính chiếc PC của mình.

    Reduced resolution-giảm độ phân giải của hình ảnh thu được so với độ phân giải gốc,chỉ hoạt động khi cần capture thời gian thực những chương trình truyền hình trực tuyến.Loại nguồn này được gọi là streaming,những treaming nổi tiếng và phổ biến nhất có thể kể ra là WMA của M$,realvideo của RealNetworks,Quicktime của Apple.
    (tính năng này chỉ xuất hiện ở XviD 1.0.3,khi tôi dùng bản 1.1 beta 2 thì không có)

    [I][SIZE="2"]Trước khi tiếp tục phần tiếp theo,hãy để tôi giải thích một chút với các bạn về khái niệm các loại frame.
    Một chuỗi các hình ảnh tạo thành một đoạn film hoàn chỉnh mà bạn nhìn thấy,mỗi hình ảnh đó gọi là một khung hình(frame).Trong điện ảnh,người ta thường coi 24 khung hình/giây(frame/sec) là đủ để mắt người có thể cảm nhận chuyển động giống như nó xảy ra liên tục.
    Đối với video kỹ thuật số,đặc biệt là mpeg-4,các frame không phải là bình đẳng như nhau,chúng được xử lý với những cách thức khác nhau và được phân làm 3 loại:

    - I frame-ỉntra frame-hay ỉntra picture:là những frame hoàn chỉnh theo đúng nghĩa(có nghĩa là nếu tách riêng I frame ra ta sẽ được một bức ảnh hoàn chỉnh).Nó còn được gọi là *** Frame.

    - P-frame-predictively coded frame-là những frame chỉ lưu những thông tin khác nhau từ những frame trước.Mỗi P-frame sẽ tham khảo dữ liệu hình ảnh từ feame trước nó và chỉ định cho B-frame và P-frame sau nó trong một nhóm frame(GOP- Group of pictures).Mỗi macroblock(16x16 block)của P-frame có thể được encode độc lập hay được bổ xung từ frame đến trước nó.

    - B-frame- Bi-Directionally Predictively Coded Frame-cũng như P-frame,không phải là một frame hoàn chỉnh,nó chỉ mang thông tin khác biệt giữa nó và 2 frame đứng cạnh nó(trước và sau).B-frame cũng được dự đoán(predict) bới 2 frame này.Bởi vì có sự liên kết,tham khảo với cả 2 frame trước và sau nên tên của loại frame này là "Bidirectional-frame" hay frame 2 chiều.

    Cách hoạt động:đầu tiên ta có một nhóm picture(GOP-Group of pictures),ở đầu mỗi nhóm này là một I-frame lưu đầy đủ giữ liệu của một hình ảnh.Các P-frame và B-frame đứng sau I-frame này và lưu các giữ liệu thể hiện sự khác nhau giữa các frame đứng trước hay sau chúng,mặt khác chúng cũng liên kết với I-frame trong nhóm để tìm thông tin cần thiết.

  14. wookie - 24-11-2006 08:26 PM
    Ví dụ:ta có 1 GOP như sau:IBBPBBBPBBBPBBP,trong GOP này,I sẽ là frame đứng đầu nhóm và P sẽ là frame kết thúc nhóm,sau P chắc chắn sẽ là một I-frame để bắt đầu GOP tiếp theo.Cụ thể hơn,nếu ta có một đoạn film quay cảnh một chiếc xe hơi đang di chuyển từ phải qua trái,đầu tiên,I-frame sẽ lưu lại đầy đủ hình ảnh của chiếc xe khi nó ở bên phải,sau đó,các B hay P frame thay vì tiếp tục lưu những hình ảnh hoàn chỉnh của chiếc xe sẽ chỉ nhận ra những điểm khác ở thời điểm xảy ra frame đó với I-frame đầu nhóm,rốt cuộc hình ảnh chiếc xe khi nó ở bên trái màn hình thực chất ra không phải là một hình ảnh theo đúng nghĩa,frame ở vị trí đó sẽ chỉ làm nhiệm vụ là di chuyển chiếc xe từ phía bên phải qua bằng cách chỉ ra tọa độ để đặt chiếc xe vào đó(trên thực tế mọi việc diễn ra phúc tạp hơn)

    Với cách phân chia như vậy,I-frame là frame có dung lượng lớn nhất(thường là gấp hơn 5 lần so với B-frame với các setting và matrix tôi hay sử dụng),P-frame có dung lượng lớn hơn B-frame nhưng đa số vẫn nhỏ hơn so với I-frame.Trong một file mpeg,số lượng I-frame là ít nhất,chúng đóng vai trò là hình ảnh đầu tiên mỗi khi chuyển cảnh,nhiều hơn là P-frame và nhiều nhất là b-frame.Khi kéo thanh trượt trên chương trình playback mpeg,những hình ảnh mà chúng ta có thể truy cập tới chính là những I-frame,đó cũng là một lý do loại frame này được gọi là *** frame.[/SIZE][/I]

    B-VOPs-là tùy chọn dành cho những người đã đọc qua phần trên

    Max consecutive BVOPs:số B-frame giới hạn được phép đứng liền nhau.Như tôi đã trình bày ở trên,càng nhiều B-frame có nghĩa là video càng thể hiện đại khái(bởi nó không lưu những hình ảnh hoàn chỉnh và cũng không đóng vai trò liên kết,tiên đoán như P-frame).Nhưng điểm mạnh của B-frame là kích thước rất nhỏ,do đó dung lượng file nén sẽ nhỏ và thời gian sẽ không lâu như khi dùng nhiều I-frame hơn.Để tham khảo thêm,bạn nên biết DivX codec chỉ đặt hệ số này là 1.Và bạn không nên đặt quá 3 nếu không muốn thu được 1 kết quả tồi.Cá nhân tôi thường đặt 3 khi encode VCD và đặt 2 với DVD.

    Quantizer ratio chỉ định độ nén của B-frame là hơn bao nhiêu so với P-frame(đơn vị tính theo quantizer),bình thường hệ số này là 1,5.
    Quantizer offset là một hệ sô được bù thêm vào mỗi quantizer.
    Lấy một ví dụ để bạn hiểu rõ hơn về hai hệ số này:có hai B-frame,một p-frame đứng giữa hai b-frame này.P-frame có quantizer là 2,vậy khi ta set ratio và offset là 1,các B-frame kể trên sẽ mang quantizer là 3.
    Packet bitstream sẽ nhóm các B và P-frame cạnh nhau vào một bitstream.Ví dụ:[i][PB][b][trống][PB][b][trống][P].Dạng đóng gói như thế này sẽ cho phép encoding không bị trì hoãn.
    Closed GOV (trong hình mà tôi dùng để minh họa không có tùy chọn này,nếu phiên bản của bạn dùng có closed GOV,nó sẽ hiện cùng dòng với packet bitstream.Closed GOV sẽ tạo ra những closed GOP-là GOV có frame cuối cùng là P-frame.Điều này đồng nghĩa với việc trước mỗi I-frame sẽ là một P-frame.Tác dụng của closed GOP là sẽ tạo ra những file mpeg có thể chỉnh sửa được(trái ngược với một fiel mpeg dùng open GOP sẽ không thể chỉnh sửa được).

    Level

    Ta chuyển qua Tab level,ở đây không có gì để bạn chỉnh sửa ngoài việc chọn level(công việc mà chúng ta đã làm ngay từ đầu).Đây có thể coi là phần tham khảo thêm để bạn thực sự hiểu rõ mỗi profile @ level sẽ tương ứng với những “cấu hình” nào cho file tạo thành.

    level

    Aspect Ratio(AR)
    AR

    Pixel AR :
    XviD theo mặc định sẽ giữ tỉ lệ pixel là 1:1(ngang x dọc) để đảm bảo tương thích.Điều đó có nghĩa là pixel mặc định của XviD sẽ là hình vuông.Ta cũng có thể chỉnh pixel AR tương ứng với tỷ lệ của file gốc.

    Display AR :có thể hiểu đây là tỷ lệ khung hình,hay tỉ lệ giữa chiều dài và chiều rộng.
    Ở một số codec,chiều dài phải chia hết cho một số nhất định nào đó,chiều rộng cũng vậy,ví dụ như trong DivX6,chiều dài phải chia hết cho 4-chiều rộng phải chia hết cho 2,ở 3ivx chiều dài và chiều rộng phải chia hết cho 2.Chiều dài x chiều rộng của XviD encode không bị giới hạn bởi bất kỳ điều kiện nào cả.Nhưng một lời khuyên chung cho mpeg4 là bạn nên để chiều dài và chiều rộng chia hết cho 16 để chắc chắn quá trình giải mã không gặp vấn đề rắc rối(có thể dẫn tới không thể giải mã nổi file).Nếu không hài lòng với việc chọn Pixel AR,bạn có thể sử dụng tùy chọn này.Nhưng hãy nhớ chỉ chọn tỉ lệ khi bạn hiểu rõ khung hình mình thu được trông sẽ ra sao.Trong quá trình encode mpeg4 của mình,tôi thường đặt phần AR này ở cấu hình mặc định và kết quả thu được là rất tốt mà không cần bận tâm gì cả.
    Nhấn OK để quay trở ra màn hình chính,bây giờ là lúc xem xét hình thức encode.

    Encoding Type

    Bạn cần quyết định mình sẽ chọn loại mã hóa nào.Sau đây là các trường hợp thường thấy:

    -Bạn có ít thời gian chạy máy tính,máy tính của bạn không có tốc độ tốt lắm cho việc encode video,bạn chỉ cần những file mpeg4 có chất lượng tạm chấp nhận được…vậy thì bạn rất thích hợp để chọn Single pass.Đặc điểm của single pass là bạn chỉ encode một lần,sau đó thu được kết quả ngay,và chất lượng thu được thì không thể coi là tốt đặc biệt là ở bitrate thấp.

    -Bạn có một chiếc máy tính với khả năng xử lý không tồi,bạn đặc biệt yêu thích video chất lượng cao và sẵn sàng dành nhiều thời gian cho sở thích này,chắc chắn bạn phải encode Twopass rồi.So với single pass thì loại encode này sẽ lấy đi của bạn khoảng thời gian gần gấp đôi cho cùng một file encode,chất lượng thu được thì rất tốt vì ngoài một bước dựng hình(pass 2) ta đã có thêm một bước phân tích(pass 1)

    Vậy bình thường nên chọn type nào?dĩ nhiên tôi sẽ khuyên bạn luôn encode 2 pass,bởi vì bạn chỉ encode một lần thôi trong khi video đó bạn chắc chắn sẽ xem nhiều hơn một lần,vì vậy đã làm thì phải đến nơi đến chốn.Nhưng hãy suy nghĩ lại nếu bạn có một chiếc máy tính quá yếu.Tưởng tượng rằng processor của bạn có tốc độ 500 Mhz và bạn chỉ có 64MB RAM,encode một bộ film dài khoảng 2 tiếng chắc chắn sẽ ngốn của bạn khoảng 10 giờ/1pass,vậy là nếu bạn dùng 2 pass,bạn sẽ mất cả ngày trời bật máy chạy liên tục mà không làm được gì cả ngoài việc chờ đợi nó nén xong film(thật là cực hình)…
    Tuy nhiên,hãy kiên nhẫn đọc đến phần cuối cùng,tôi sẽ mách cho bạn vài thủ thuật để sự việc trở nên đơn giản hơn.

    Cách setting cho các pass
    Single pass

    enctype

    Không cần phải bận tâm về những setting với dạng encode này lắm,một khi ban đã chọn single pass,không thể hy vọng sẽ thu được chất lượng cao trừ khi bạn nâng bitrate lên đáng kể.
    Chất lượng hình ảnh sẽ được quyết định qua Target bitrate hay Target Quantizer

  15. wookie - 24-11-2006 08:26 PM
    Ví dụ:ta có 1 GOP như sau:IBBPBBBPBBBPBBP,trong GOP này,I sẽ là frame đứng đầu nhóm và P sẽ là frame kết thúc nhóm,sau P chắc chắn sẽ là một I-frame để bắt đầu GOP tiếp theo.Cụ thể hơn,nếu ta có một đoạn film quay cảnh một chiếc xe hơi đang di chuyển từ phải qua trái,đầu tiên,I-frame sẽ lưu lại đầy đủ hình ảnh của chiếc xe khi nó ở bên phải,sau đó,các B hay P frame thay vì tiếp tục lưu những hình ảnh hoàn chỉnh của chiếc xe sẽ chỉ nhận ra những điểm khác ở thời điểm xảy ra frame đó với I-frame đầu nhóm,rốt cuộc hình ảnh chiếc xe khi nó ở bên trái màn hình thực chất ra không phải là một hình ảnh theo đúng nghĩa,frame ở vị trí đó sẽ chỉ làm nhiệm vụ là di chuyển chiếc xe từ phía bên phải qua bằng cách chỉ ra tọa độ để đặt chiếc xe vào đó(trên thực tế mọi việc diễn ra phúc tạp hơn)

    Với cách phân chia như vậy,I-frame là frame có dung lượng lớn nhất(thường là gấp hơn 5 lần so với B-frame với các setting và matrix tôi hay sử dụng),P-frame có dung lượng lớn hơn B-frame nhưng đa số vẫn nhỏ hơn so với I-frame.Trong một file mpeg,số lượng I-frame là ít nhất,chúng đóng vai trò là hình ảnh đầu tiên mỗi khi chuyển cảnh,nhiều hơn là P-frame và nhiều nhất là b-frame.Khi kéo thanh trượt trên chương trình playback mpeg,những hình ảnh mà chúng ta có thể truy cập tới chính là những I-frame,đó cũng là một lý do loại frame này được gọi là *** frame.[/SIZE][/I]

    B-VOPs-là tùy chọn dành cho những người đã đọc qua phần trên

    Max consecutive BVOPs:số B-frame giới hạn được phép đứng liền nhau.Như tôi đã trình bày ở trên,càng nhiều B-frame có nghĩa là video càng thể hiện đại khái(bởi nó không lưu những hình ảnh hoàn chỉnh và cũng không đóng vai trò liên kết,tiên đoán như P-frame).Nhưng điểm mạnh của B-frame là kích thước rất nhỏ,do đó dung lượng file nén sẽ nhỏ và thời gian sẽ không lâu như khi dùng nhiều I-frame hơn.Để tham khảo thêm,bạn nên biết DivX codec chỉ đặt hệ số này là 1.Và bạn không nên đặt quá 3 nếu không muốn thu được 1 kết quả tồi.Cá nhân tôi thường đặt 3 khi encode VCD và đặt 2 với DVD.

    Quantizer ratio chỉ định độ nén của B-frame là hơn bao nhiêu so với P-frame(đơn vị tính theo quantizer),bình thường hệ số này là 1,5.
    Quantizer offset là một hệ sô được bù thêm vào mỗi quantizer.
    Lấy một ví dụ để bạn hiểu rõ hơn về hai hệ số này:có hai B-frame,một p-frame đứng giữa hai b-frame này.P-frame có quantizer là 2,vậy khi ta set ratio và offset là 1,các B-frame kể trên sẽ mang quantizer là 3.
    Packet bitstream sẽ nhóm các B và P-frame cạnh nhau vào một bitstream.Ví dụ:[i][PB][b][trống][PB][b][trống][P].Dạng đóng gói như thế này sẽ cho phép encoding không bị trì hoãn.
    Closed GOV (trong hình mà tôi dùng để minh họa không có tùy chọn này,nếu phiên bản của bạn dùng có closed GOV,nó sẽ hiện cùng dòng với packet bitstream.Closed GOV sẽ tạo ra những closed GOP-là GOV có frame cuối cùng là P-frame.Điều này đồng nghĩa với việc trước mỗi I-frame sẽ là một P-frame.Tác dụng của closed GOP là sẽ tạo ra những file mpeg có thể chỉnh sửa được(trái ngược với một fiel mpeg dùng open GOP sẽ không thể chỉnh sửa được).

    Level

    Ta chuyển qua Tab level,ở đây không có gì để bạn chỉnh sửa ngoài việc chọn level(công việc mà chúng ta đã làm ngay từ đầu).Đây có thể coi là phần tham khảo thêm để bạn thực sự hiểu rõ mỗi profile @ level sẽ tương ứng với những “cấu hình” nào cho file tạo thành.

    level

    Aspect Ratio(AR)
    AR

    Pixel AR :
    XviD theo mặc định sẽ giữ tỉ lệ pixel là 1:1(ngang x dọc) để đảm bảo tương thích.Điều đó có nghĩa là pixel mặc định của XviD sẽ là hình vuông.Ta cũng có thể chỉnh pixel AR tương ứng với tỷ lệ của file gốc.

    Display AR :có thể hiểu đây là tỷ lệ khung hình,hay tỉ lệ giữa chiều dài và chiều rộng.
    Ở một số codec,chiều dài phải chia hết cho một số nhất định nào đó,chiều rộng cũng vậy,ví dụ như trong DivX6,chiều dài phải chia hết cho 4-chiều rộng phải chia hết cho 2,ở 3ivx chiều dài và chiều rộng phải chia hết cho 2.Chiều dài x chiều rộng của XviD encode không bị giới hạn bởi bất kỳ điều kiện nào cả.Nhưng một lời khuyên chung cho mpeg4 là bạn nên để chiều dài và chiều rộng chia hết cho 16 để chắc chắn quá trình giải mã không gặp vấn đề rắc rối(có thể dẫn tới không thể giải mã nổi file).Nếu không hài lòng với việc chọn Pixel AR,bạn có thể sử dụng tùy chọn này.Nhưng hãy nhớ chỉ chọn tỉ lệ khi bạn hiểu rõ khung hình mình thu được trông sẽ ra sao.Trong quá trình encode mpeg4 của mình,tôi thường đặt phần AR này ở cấu hình mặc định và kết quả thu được là rất tốt mà không cần bận tâm gì cả.
    Nhấn OK để quay trở ra màn hình chính,bây giờ là lúc xem xét hình thức encode.

    Encoding Type

    Bạn cần quyết định mình sẽ chọn loại mã hóa nào.Sau đây là các trường hợp thường thấy:

    -Bạn có ít thời gian chạy máy tính,máy tính của bạn không có tốc độ tốt lắm cho việc encode video,bạn chỉ cần những file mpeg4 có chất lượng tạm chấp nhận được…vậy thì bạn rất thích hợp để chọn Single pass.Đặc điểm của single pass là bạn chỉ encode một lần,sau đó thu được kết quả ngay,và chất lượng thu được thì không thể coi là tốt đặc biệt là ở bitrate thấp.

    -Bạn có một chiếc máy tính với khả năng xử lý không tồi,bạn đặc biệt yêu thích video chất lượng cao và sẵn sàng dành nhiều thời gian cho sở thích này,chắc chắn bạn phải encode Twopass rồi.So với single pass thì loại encode này sẽ lấy đi của bạn khoảng thời gian gần gấp đôi cho cùng một file encode,chất lượng thu được thì rất tốt vì ngoài một bước dựng hình(pass 2) ta đã có thêm một bước phân tích(pass 1)

    Vậy bình thường nên chọn type nào?dĩ nhiên tôi sẽ khuyên bạn luôn encode 2 pass,bởi vì bạn chỉ encode một lần thôi trong khi video đó bạn chắc chắn sẽ xem nhiều hơn một lần,vì vậy đã làm thì phải đến nơi đến chốn.Nhưng hãy suy nghĩ lại nếu bạn có một chiếc máy tính quá yếu.Tưởng tượng rằng processor của bạn có tốc độ 500 Mhz và bạn chỉ có 64MB RAM,encode một bộ film dài khoảng 2 tiếng chắc chắn sẽ ngốn của bạn khoảng 10 giờ/1pass,vậy là nếu bạn dùng 2 pass,bạn sẽ mất cả ngày trời bật máy chạy liên tục mà không làm được gì cả ngoài việc chờ đợi nó nén xong film(thật là cực hình)…
    Tuy nhiên,hãy kiên nhẫn đọc đến phần cuối cùng,tôi sẽ mách cho bạn vài thủ thuật để sự việc trở nên đơn giản hơn.

    Cách setting cho các pass
    Single pass

    enctype

    Không cần phải bận tâm về những setting với dạng encode này lắm,một khi ban đã chọn single pass,không thể hy vọng sẽ thu được chất lượng cao trừ khi bạn nâng bitrate lên đáng kể.
    Chất lượng hình ảnh sẽ được quyết định qua Target bitrate hay Target Quantizer

Trang 1/2 1 2 cuốicuối