亚洲激情综合另类男同-中文字幕一区亚洲高清-欧美一区二区三区婷婷月色巨-欧美色欧美亚洲另类少妇

首頁 優(yōu)秀范文 壓縮技術(shù)論文

壓縮技術(shù)論文賞析八篇

發(fā)布時(shí)間:2023-03-06 15:59:30

序言:寫作是分享個(gè)人見解和探索未知領(lǐng)域的橋梁,我們?yōu)槟x了8篇的壓縮技術(shù)論文樣本,期待這些樣本能夠?yàn)槟峁┴S富的參考和啟發(fā),請(qǐng)盡情閱讀。

壓縮技術(shù)論文

第1篇

關(guān)鍵詞:XML;后綴樹;后綴數(shù)組;自索引;BWT

中圖分類號(hào):TP311.13 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1674-7712 (2012) 06-0099-01

一、數(shù)據(jù)壓縮知識(shí)

數(shù)據(jù)壓縮技術(shù)的發(fā)展。

隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展,數(shù)據(jù)壓縮作為解決海量信息存儲(chǔ)和傳輸?shù)闹渭夹g(shù)受到了人們的極大重視,對(duì)數(shù)據(jù)壓縮算法的研究也不僅局限于信息論中有關(guān)信源編碼的范疇,數(shù)字圖像信號(hào)、語音信號(hào)的分析和處理等技術(shù)被大量引入到有關(guān)的研究領(lǐng)域。

1977年,兩位以色列科學(xué)家Jacob Ziv和Abraham Lempel發(fā)表了名為“A Universal Algorithm for Sequential Data Compression”(順序數(shù)據(jù)壓縮的通用算法)的論文,提出了一種不同與以往的基于字典的壓縮方法——LZ77,他們?cè)?978年又提出了LZ77的改進(jìn)算法——LZ78,這兩個(gè)算法吧數(shù)據(jù)壓縮的研究推向了一個(gè)全新的階段。1984年,Terry Weleh發(fā)表的論文“A Technique for High Performance Data Compression”(高性能數(shù)據(jù)壓縮技術(shù))描述了對(duì)LZ78算法的改進(jìn)和具體實(shí)現(xiàn)技術(shù),成為LZW算法。目前,無損數(shù)據(jù)壓縮領(lǐng)域中流行的數(shù)據(jù)壓縮方法多是基于字典的壓縮技術(shù)。UNIX系統(tǒng)上的一個(gè)實(shí)用壓縮軟件COMPRESS和Windows系統(tǒng)下的壓縮軟件Winzip和Winrar中所使用的壓縮算法都是基于字典壓縮技術(shù)的。

當(dāng)數(shù)據(jù)壓縮被用于減少存儲(chǔ)空間時(shí),可以減少程序的總執(zhí)行時(shí)間。這是因?yàn)榇鎯?chǔ)量的減少將導(dǎo)致磁盤存取次數(shù)的減少,雖然數(shù)據(jù)的壓縮/解壓縮過程會(huì)增加額外的程序指令,但由于程序的執(zhí)行時(shí)間通常少于數(shù)據(jù)的存儲(chǔ)時(shí)間,因此中的執(zhí)行時(shí)間將減少。也正因如此,數(shù)據(jù)壓縮技術(shù)在計(jì)算機(jī)技術(shù)飛速發(fā)展的今天仍然有著很重要的作用。

二、XML壓縮索引

(一)XML壓縮背景

上文中已經(jīng)述說了XML的優(yōu)點(diǎn),但和其它形式的數(shù)據(jù)表示相比,XML文檔往往很大。因此有些時(shí)候,傳輸速度和存儲(chǔ)空間會(huì)非常重要。具體來說:

1.XML是一種清晰而易用的文本標(biāo)記格式,但它的弱點(diǎn)就是當(dāng)有大量數(shù)據(jù)需要交換,而程序內(nèi)部處理部分又非常少時(shí),會(huì)導(dǎo)致XML文檔非常大,這樣過大的空間占用意味著更大的處理代價(jià);

2.由于本文壓縮算法多年來一直是大量研究項(xiàng)目的課題,目前已經(jīng)非常成熟。這種類型的算法都能方便的將XML進(jìn)行壓縮,但將XML文本作為一般文本文件進(jìn)行壓縮,這類算法都不大可能改善處理的速度,而且還會(huì)增加了解壓后再解析的步驟;

3.我們把XML文檔用于索引結(jié)構(gòu),這樣就不能只保持了XML文檔的結(jié)構(gòu)而無法對(duì)XML進(jìn)行索引搜索。也就排除了一些簡單的XML壓縮算法。

(二)XML壓縮方法

當(dāng)壓縮文檔時(shí),通常首先考慮常用的壓縮算法,如:Lempel-Ziv和Huffman,以及在它們上面實(shí)現(xiàn)變化的一些常用實(shí)用程序。在類Unix平臺(tái)上通常是gzip;在其它平臺(tái)上,zip更為常用,比如:PKZIP、Info-ZIP和WinZip。但這些實(shí)用程序?qū)嶋H上意在充分地減少XML文件的大小。但是,都沒有保持了XML文檔的結(jié)構(gòu),或是無法對(duì)XML文檔進(jìn)行索引。這樣本文選擇使用BWT壓縮算法而不是順序Lempel-Ziv算法。

(三)BWT數(shù)據(jù)壓縮

利用BWT壓縮算法,我們先把字符文本進(jìn)行轉(zhuǎn)換,然后進(jìn)行壓縮,這樣就解決了XML文檔過大的弊端。而且BWT壓縮算法要比順序LZ算法,解壓時(shí)速度有所提高。BWT算法的具體介紹我們?cè)诘?章進(jìn)行講解。

三、系統(tǒng)設(shè)計(jì)

(一)XML文件整體輸出

首先,我們先不考慮XML文件的結(jié)構(gòu),這樣把XML數(shù)據(jù)文件提交給程序,會(huì)按照普通文本文件的方式進(jìn)行處理。程序先讀取整個(gè)文件的內(nèi)容,之后將它們作為一個(gè)字符串,進(jìn)行后綴數(shù)組排序,然后BWT轉(zhuǎn)換。但是這樣的結(jié)果并不如意,有以下兩個(gè)缺點(diǎn):

1.程序執(zhí)行的效率不高,文件內(nèi)容如過大,導(dǎo)致整體的速度下降;

2.不便于查找,整體進(jìn)行排序換轉(zhuǎn)后打亂了文件結(jié)構(gòu),不能成為索引;

(二)以XML文件結(jié)構(gòu)進(jìn)行輸出

由于不能破壞XML文件的結(jié)構(gòu),只能按照XML現(xiàn)有的標(biāo)簽內(nèi)容進(jìn)行。這樣我們就引入了XML解析器,它可以分析出XML文件的結(jié)果和具體內(nèi)容。先用解析器解析XML文件,我們就方便的判斷出,什么是標(biāo)簽,什么是數(shù)據(jù)。把每個(gè)標(biāo)簽或者數(shù)據(jù),單獨(dú)進(jìn)行排序轉(zhuǎn)換。

具體過程:

1.XML解析器讀取分析XML文件;

2.建立一個(gè)空的XML文件,進(jìn)行添加排序轉(zhuǎn)換后的數(shù)據(jù);

3.如分析出標(biāo)簽開始,則提取此標(biāo)簽,對(duì)其進(jìn)行排序轉(zhuǎn)換,把結(jié)果插入新的XML文件;并記住此標(biāo)簽的級(jí)別,用于插入下級(jí)標(biāo)簽時(shí)使用;

4.如分析出數(shù)據(jù),則對(duì)數(shù)據(jù)進(jìn)行排序轉(zhuǎn)換,并直接把新數(shù)據(jù)插入包含它的標(biāo)簽中;

5.如分析出標(biāo)簽結(jié)束,則關(guān)閉此級(jí)標(biāo)簽,結(jié)束數(shù)據(jù)轉(zhuǎn)換;并記錄新的標(biāo)簽級(jí)別,用于插入平級(jí)標(biāo)簽時(shí)使用。

參考文獻(xiàn):

[1]Donald Knuth.Art of Computer Programming[M].2002,Volume,3

第2篇

論文摘 要 智能交通系統(tǒng) (ITS) 是集成于信息技術(shù)、傳輸技術(shù)、電子技術(shù)、及計(jì)算機(jī)處理技術(shù)等多種類電子工程技術(shù),而建立起的實(shí)時(shí)、高效、準(zhǔn)確的綜合運(yùn)輸和管理體系。其中,數(shù)據(jù)壓縮和數(shù)據(jù)融合技術(shù)使得ITS技術(shù)更具有現(xiàn)實(shí)意義。本文基于智能交通系統(tǒng)中信息的特征,探討了數(shù)據(jù)壓縮和數(shù)據(jù)融合技術(shù)涉及的關(guān)鍵技術(shù)及要求,分析了技術(shù)應(yīng)用及現(xiàn)實(shí)突破。

1 ITS信息及特征分析

1.1 智能交通信息(ITS)

交通系統(tǒng)由包括4個(gè)基本要素:人(交通出行者、駕駛員和管理者)、物(貨物)、各類交通工具和相應(yīng)的交通設(shè)施構(gòu)成。交通信息是指所有與交通系統(tǒng)的四大要素相關(guān)聯(lián)的信息,是ATMS的關(guān)鍵基礎(chǔ)。面向ATMS的基礎(chǔ)交通信息主要是指與交通運(yùn)行狀態(tài)和交通管理有關(guān)的交通信息,是交通信息中最直接、最基礎(chǔ)的信息?;A(chǔ)交通信息包括基礎(chǔ)交通地理信息、交通實(shí)時(shí)狀態(tài)信息、交通控制和管理信息、交通政策法規(guī)信息、公共交通信息。

1.2 基礎(chǔ)交通信息的屬性特征

基礎(chǔ)交通信息是一種在大范圍內(nèi)、全方位發(fā)揮作用的,實(shí)時(shí)、準(zhǔn)確、高效的綜合運(yùn)輸和管理系統(tǒng),其應(yīng)具有以下一些基本屬性特征:1)準(zhǔn)確性;2)及時(shí)性;3)共享性;4)信息的采集具有實(shí)時(shí)性和動(dòng)態(tài)性;5)具有海量信息特征;6)增值性。

2 數(shù)據(jù)壓縮處理技術(shù)

交通信息一方面時(shí)采集到的信息煩雜多樣,要想利用這些不同類別的信息,需采用不同的處理方法;另一方面,交通信息的一個(gè)顯著特征是它的空間性和隨機(jī)性,因此對(duì)它的研究分析需要建立在廣泛統(tǒng)計(jì)的基礎(chǔ)上,應(yīng)用各類信息處理技術(shù)和統(tǒng)計(jì)分析方法來探索它的規(guī)律性。

所謂多媒體技術(shù)就是能對(duì)多種載體(媒體)上的信息和多種存儲(chǔ)(媒質(zhì))上的信息進(jìn)行處理的技術(shù),特點(diǎn)主要表現(xiàn)在它的綜合性和交互性。交通信息是屬于多媒體信息范疇。若要實(shí)時(shí)的綜合處理聲音、圖像、視頻、文字等多媒體信息,其數(shù)據(jù)量是非常大的。要傳輸或存儲(chǔ)這樣大的數(shù)據(jù)量是非常困難的,必須對(duì)其進(jìn)行壓縮編碼,在滿足實(shí)際需要的前提下,盡量減少要傳輸或存儲(chǔ)的數(shù)據(jù)量。

數(shù)據(jù)壓縮主要依靠信源編碼技術(shù)。一般的,圖像壓縮技術(shù)可分為兩大類:無損壓縮和有損壓縮技術(shù)。在多媒體應(yīng)用中常用的壓縮方法有PCM(脈沖編碼調(diào)制)、預(yù)測(cè)編碼、變換編碼、插值和外推法、統(tǒng)計(jì)編碼、矢量量化和子帶編碼等;混合編碼是近年來廣泛采用的方法。新一代的數(shù)據(jù)壓縮方法,如基于模型的壓縮方法、分形壓縮和小波變換方法等也已經(jīng)接近實(shí)用化水平。

3 信息融合技術(shù)

信息融合技術(shù)在單純數(shù)據(jù)采集融合(即一次融合)階段稱為數(shù)據(jù)融合,是研究多種信息的獲取、傳輸與處理的基本方法、技術(shù)、手段以及信息的表示、內(nèi)在聯(lián)系和運(yùn)動(dòng)規(guī)律的一門技術(shù)。融合是指采集并集成各種信息源、多媒體和多格式信息,從而生成完整、準(zhǔn)確、及時(shí)和有效的綜合信息,它比直接從各信息源得到的信息更簡潔、更少冗余、更有用途。

先進(jìn)的交通管理系統(tǒng)(ATMS)是一個(gè)典型的多傳感器系統(tǒng),信息融合技術(shù)給交通信息加工和處理提供了一種很好的方法,信息融合技術(shù)的最大優(yōu)勢(shì)在于它能合理協(xié)調(diào)多源數(shù)據(jù),充分綜合有用信息,提高在多變環(huán)境中正確決策的能力。

在信息融合領(lǐng)域使用的主要數(shù)學(xué)工具或方法有概率論、推理網(wǎng)絡(luò)、模糊理論和神經(jīng)網(wǎng)絡(luò)等,其中使用較多的是概率論、模糊理論、推理網(wǎng)絡(luò)。當(dāng)然,除了這幾種常用的方法之外,還有其他很多解決途徑。

3.1 概率論

在融合技術(shù)中最早應(yīng)用的就是概率論。在一個(gè)公共空間根據(jù)概率或似然函數(shù)對(duì)輸入數(shù)據(jù)建模,在一定的先驗(yàn)概率情況下,根據(jù)貝葉斯規(guī)則合并這些概率以獲得每個(gè)輸出假設(shè)的概率,這樣可以處理不確定性問題。貝葉斯方法的主要難點(diǎn)在于對(duì)概率分布的描述,特別是當(dāng)數(shù)據(jù)是由低檔傳感器給出時(shí),就顯得更為困難。另外,在進(jìn)行計(jì)算的時(shí)候,常常簡單地假定信息源是獨(dú)立的,這個(gè)假設(shè)在大多數(shù)情況下非常受限制??柭鼮V波方法則根據(jù)早先估計(jì)和最新觀測(cè),遞推地提供對(duì)觀測(cè)特性的估計(jì)。另外,概率論和模糊集理論的綜合應(yīng)用給解決多源數(shù)據(jù)的融合問題提供了工具。

3.2 模糊理論

模糊集理論是基于分類的局部理論,因此,從產(chǎn)生起就有許多模糊分類技術(shù)得以發(fā)展。隸屬函數(shù)可以表達(dá)詞語的意思,這在數(shù)字表達(dá)和符號(hào)表達(dá)之間建立了一個(gè)便利的交互接口。在信息融合的應(yīng)用中主要是通過與特征相連的規(guī)則對(duì)專家知識(shí)進(jìn)行建模。另外,可以采用模糊理論來對(duì)數(shù)字化信息進(jìn)行嚴(yán)格地、折衷或是寬松地建模。模糊理論的另一個(gè)方面是可以處理非精確描述問題,還能夠自適應(yīng)地歸并信息。對(duì)估計(jì)過程的模糊拓展可以解決信息或決策沖突問題,應(yīng)用于傳感器融合、專家意見綜合以及數(shù)據(jù)庫融合,特別是在信息很少,又只是定性信息的情況下效果較好。

3.3 推理網(wǎng)絡(luò)

推理網(wǎng)絡(luò)的構(gòu)建和應(yīng)用有著很長的歷史,可以追溯到1913年由一位名叫John H W ig-more的美國學(xué)者所做的研究工作。近來,許多對(duì)于分析復(fù)雜推理網(wǎng)絡(luò)的理論往往基于貝葉斯規(guī)則的推論,并且都被歸類于貝葉斯網(wǎng)絡(luò)。目前,大多數(shù)貝葉斯網(wǎng)絡(luò)的研究都包括了對(duì)于概率有效傳播的算法拓展,同時(shí)它在整個(gè)網(wǎng)絡(luò)中也充當(dāng)了新證據(jù)的角色。同時(shí)貝葉斯網(wǎng)絡(luò)在許多A1任務(wù)里都己作為對(duì)于不確定推理的標(biāo)準(zhǔn)化有效方法。貝葉斯網(wǎng)絡(luò)的優(yōu)點(diǎn)是簡潔、易于處理相關(guān)事件。缺點(diǎn)是不能區(qū)分不知道和不確定事件,并且要求處理的對(duì)象具有相關(guān)性。在實(shí)際運(yùn)用中一般不知道先驗(yàn)概率,當(dāng)假定的先驗(yàn)概率與實(shí)際相矛盾時(shí),推理結(jié)果很差,特別是在處理多假設(shè)和多條件問題時(shí)顯得相當(dāng)復(fù)雜。

參考文獻(xiàn)

[1]楊兆升.基礎(chǔ)交通信息融合技術(shù)及其應(yīng)用[M].北京:中國鐵道出版社,2005.

[2]史其信,陸化普.中國 ITS 發(fā)展戰(zhàn)略構(gòu)想[J].公路交通科技,1998,3.

第3篇

關(guān)鍵詞:多媒體通信;IP;視頻會(huì)議

Abstract: According to the main features of the IP network, focusing on network bandwidth, compression technology, multicast technology, transport protocol, QOS, and other aspects of the five IP-based video conferencing system, building a network of technical requirements.

Key words: multi-media communication; IP; video conferencing

1 前言

隨著多媒體計(jì)算機(jī)技術(shù)和通信技術(shù)的發(fā)展,產(chǎn)生了一種新的技術(shù)——多媒體通信技術(shù),它是多媒體、通信、計(jì)算機(jī)和網(wǎng)絡(luò)等相互滲透和發(fā)展的產(chǎn)物,兼收了計(jì)算機(jī)的交互性、多媒體的復(fù)合性、通信的分布性以及電視的真實(shí)性等特點(diǎn),具有明顯的優(yōu)越性。目前,如何在IP網(wǎng)絡(luò)中更好、更快地實(shí)現(xiàn)視頻、音頻的傳送已成為當(dāng)今的研究熱點(diǎn)之一。

2 基于IP網(wǎng)絡(luò)構(gòu)建視頻會(huì)議系統(tǒng)的技術(shù)要求

隨著IP網(wǎng)絡(luò)的速率越來越高,從窄帶走向?qū)拵?,承載業(yè)務(wù)從非實(shí)時(shí)走向?qū)崟r(shí),IP技術(shù)已成為實(shí)現(xiàn)視頻、音頻、數(shù)據(jù)等綜合業(yè)務(wù)的最佳選擇。在IP網(wǎng)絡(luò)上建立視頻會(huì)議系統(tǒng)需要多種技術(shù)支持,是比較復(fù)雜、完整的多媒體應(yīng)用系統(tǒng)。

2.1 要有足夠高的帶寬

要傳送視頻,必須要有足夠的網(wǎng)絡(luò)帶寬,就像大車要有足夠?qū)挼鸟R路才能通行一樣,否則,視頻數(shù)據(jù)無法通過網(wǎng)絡(luò)。以一幀1024×768像素的圖像為例,如果用12bit表示每個(gè)像素,則共需要9.4Mb,如果按照25幀/秒的傳輸速率,則1秒內(nèi)需要傳輸?shù)臄?shù)據(jù)量就是235Mb。在現(xiàn)有的網(wǎng)絡(luò)條件下,傳輸這么大的數(shù)據(jù)是無法接受的。

2.2 要有好的壓縮技術(shù)

只有采用高壓縮比的壓縮算法,有效地降低數(shù)據(jù)量,才能使視頻、音頻數(shù)據(jù)在IP網(wǎng)上傳輸成為可能。例如:在H.323會(huì)議系統(tǒng)中,圖像編碼主要采用H.261和H.263標(biāo)準(zhǔn),支持CIF、QCIF的分辨率,而正在完善之中的H.264是比H.263和MPEG-IV壓縮比更高的標(biāo)準(zhǔn),節(jié)約了50%的編碼率,而且對(duì)網(wǎng)絡(luò)傳輸具有更好的支持,可獲得HDTV、DVD的圖像質(zhì)量。

2.3 要有基于IP網(wǎng)絡(luò)的多播技術(shù)

多播是一種多地址廣播,發(fā)送與接收是一對(duì)多的關(guān)系。在傳輸過程中,發(fā)送端只需發(fā)送一次數(shù)據(jù)包,位于多播組內(nèi)的各個(gè)用戶就可以共享這一數(shù)據(jù)包。在視頻會(huì)議系統(tǒng)應(yīng)用中,將一個(gè)節(jié)點(diǎn)信號(hào)傳送到各個(gè)節(jié)點(diǎn)時(shí),無論是重復(fù)采用點(diǎn)對(duì)點(diǎn)通信,還是采用廣播的方式,都會(huì)嚴(yán)重浪費(fèi)網(wǎng)絡(luò)帶寬,而多播技術(shù)將數(shù)據(jù)傳送分布到網(wǎng)絡(luò)節(jié)點(diǎn)中,減少了網(wǎng)絡(luò)中的數(shù)據(jù)總量。

轉(zhuǎn)貼于 2.4 要有相適應(yīng)的傳輸協(xié)議

TCP、UDP協(xié)議均不能很好地支持視頻會(huì)議系統(tǒng),這就需要與之相適應(yīng)的協(xié)議,如RTP、RTCP、RSVP等。RTP運(yùn)行在UDP之上,音頻、視頻等數(shù)據(jù)被封裝在RTP數(shù)據(jù)包中,每個(gè)RTP數(shù)據(jù)包被封裝在UDP包中,然后再封裝到IP包中進(jìn)行傳輸。在底層網(wǎng)絡(luò)支持多播的情況下,RTP還可以使用多播向多個(gè)目的端點(diǎn)發(fā)送數(shù)據(jù)。RTCP是RTP的控制協(xié)議,負(fù)責(zé)反饋控制、檢測(cè)QoS和傳遞相關(guān)信息,對(duì)RTP的數(shù)據(jù)收發(fā)做相應(yīng)調(diào)整,使之最大限度地利用網(wǎng)絡(luò)資源。

2.5 要提供服務(wù)質(zhì)量保證

網(wǎng)絡(luò)服務(wù)質(zhì)量是網(wǎng)絡(luò)與用戶之間以及網(wǎng)絡(luò)上互相通信的用戶之間關(guān)于信息傳輸與共享的質(zhì)量約定。第一,在任何網(wǎng)絡(luò)中,時(shí)延總是存在的。視頻會(huì)議系統(tǒng)具有較高的實(shí)時(shí)性和可靠性要求,為了獲得各會(huì)場(chǎng)的真實(shí)的現(xiàn)場(chǎng)感,音頻、視頻的時(shí)延都要小于0.25s,最大時(shí)延抖動(dòng)應(yīng)小于10ms。其次,在視頻會(huì)議系統(tǒng)中,還要求唇音同步,只有達(dá)到時(shí)間上的同步,才能自然有效地表達(dá)關(guān)于會(huì)場(chǎng)的完整信息。第三,允許一定的丟包率。因?yàn)槿说母兄芰τ邢?,在一個(gè)視頻會(huì)議系統(tǒng)中,個(gè)別分組丟失,人眼是感覺不到的,因此可以允許一定的傳輸誤碼,丟包率應(yīng)控制在人能接受的范圍內(nèi)。

3 基于IP網(wǎng)絡(luò)構(gòu)建視頻會(huì)議系統(tǒng)的協(xié)議

基于IP網(wǎng)絡(luò)構(gòu)建視頻會(huì)議系統(tǒng)的標(biāo)準(zhǔn)主要有:H.323和SIP。

H.323沿用了傳統(tǒng)的電話信令模式,比較成熟,已經(jīng)出現(xiàn)了很多產(chǎn)品,形成了比較成熟的應(yīng)用體系和市場(chǎng)體系。SIP協(xié)議將音、視頻傳輸作為Internet上的一個(gè)應(yīng)用,增加了信令和QoS要求,借鑒了其它Internet標(biāo)準(zhǔn)和協(xié)議的設(shè)計(jì)思想,遵循簡練、開放、兼容和可擴(kuò)展等原則,比較簡單,但其推出時(shí)間不長,協(xié)議并不是很成熟,應(yīng)用也不是很多。

4 結(jié)束語

隨著網(wǎng)絡(luò)、多媒體、通信技術(shù)的飛速發(fā)展和性能的提升,基于IP網(wǎng)絡(luò)構(gòu)建視頻會(huì)議系統(tǒng)技術(shù)會(huì)不斷被發(fā)展和完善,必將以其獨(dú)特的優(yōu)勢(shì)廣泛應(yīng)用到Internet、Extranet、Intranet上,為政府機(jī)關(guān)、商業(yè)集團(tuán)、科研院所、醫(yī)療機(jī)構(gòu)及普通個(gè)人等進(jìn)行異地交流提供方便條件,成為工作、學(xué)習(xí)、生活中不可或缺的工具。

參考文獻(xiàn)

[1] 張智江,張?jiān)朴拢瑒㈨崫?SIP協(xié)議及其應(yīng)用[M].北京:電子工業(yè)出版社,2006.

[2] 沈鑫剡,等.多媒體傳輸網(wǎng)絡(luò)與VoIP系統(tǒng)設(shè)計(jì)[M].北京:人民郵電出版社,2005.

[3] Douglas E.Comer. Internetworking With TCP/IP Vol I:Principles,Protocols,and Architectures Fourth Edition[M].北京:電子工業(yè)出版社,2004.02.

第4篇

【關(guān)鍵詞】數(shù)字音視頻 MXF DV MP4

數(shù)字音頻碼流的分割及合并技術(shù)能夠快速對(duì)音視頻數(shù)據(jù)進(jìn)行刪除、替換以及增加等修改操作。在對(duì)數(shù)字高清視頻素材進(jìn)行編輯時(shí),能夠使各類高清素材完成精確幀定位并進(jìn)行剪、接等操作;能夠確保素材在分割后,擁有獨(dú)立的組織結(jié)構(gòu),以正確的格式進(jìn)行播放并且支持再次編輯;能夠使多個(gè)素材片段實(shí)現(xiàn)無縫拼接。這就使得對(duì)數(shù)據(jù)碼流的分割以及合并技術(shù)的研究顯得尤為重要,因?yàn)閿?shù)據(jù)碼流的分割與合并技術(shù)直接關(guān)系到編輯的效果。

1 數(shù)字音頻編碼標(biāo)準(zhǔn)

目前在國際上,數(shù)字音視頻編碼壓縮標(biāo)準(zhǔn)主要以MPEG和H.26X標(biāo)準(zhǔn)為主。其中,MPEG主要是針對(duì)MPEG系統(tǒng)、視頻、音頻制定的標(biāo)準(zhǔn)格式,又可分為:MPEG-1、MPEG-2、MPEG-4、MPEG-7、MPEG-21;而H.26X主要是針對(duì)多媒體通信視頻和音頻編碼制定的標(biāo)準(zhǔn)格式。

隨著數(shù)字音視頻編碼技術(shù)的不斷完善,由 SMPTE制定的DV和MXF格式,已成為當(dāng)今高清電影電視、電子新聞節(jié)目制作的主流。其中,DV是一種專業(yè)的數(shù)字音視頻采集設(shè)備、數(shù)碼影像規(guī)格,它廣泛應(yīng)用在電視電影節(jié)目制作、電子新聞采集等專業(yè)領(lǐng)域。MXF是一種通用的媒體容器格式,它可以在不同的協(xié)議和操作系統(tǒng)下工作,它能夠?qū)⒏黝悏嚎s方式的素材進(jìn)行靈活封裝。目前,音視頻素材的封裝主要以P2系列音視頻標(biāo)準(zhǔn)格式為主。它能夠直接采用MXF文件格式將音視頻素材記錄到P2卡上,提高了音視頻編輯的速度和效率,P2已經(jīng)成為高清數(shù)字音視頻編緝的主要格式。本文就是在P2格式環(huán)境下,對(duì)高、低碼率兩類素材的分割合并技術(shù)進(jìn)行研究。

2 分割及合并技術(shù)分析

要想準(zhǔn)確順利完成對(duì)數(shù)字音頻視頻文件進(jìn)行分割及合并,必須在了解MXF文件結(jié)構(gòu)、音視頻數(shù)據(jù)組織、封裝形式、素材數(shù)據(jù)等信息前提下,對(duì)文件頭部重要元素進(jìn)行分析。P2系列音視頻素材MXF文件結(jié)構(gòu)主要由頭部Partition Pack標(biāo)識(shí)的 Header Partition和Body Partition,以及Footer Partition所組成。由于Header Partition中涉及頭部元素?cái)?shù)據(jù)與索引表,Header Partition緊跟Partition Pack標(biāo)識(shí),F(xiàn)ooter Partition又對(duì)索引表進(jìn)行了拷貝;Body Partition中涉及音視頻素材實(shí)質(zhì)數(shù)據(jù),因此,P2系列音視頻素材MXF文件中的數(shù)據(jù)都將以KLV編碼組織。如下圖1所示:

為了將音視頻數(shù)據(jù)放入通用媒體容器中,則利用Body Partition Pack后的Essence Container作為能夠承受裝載的容器,并采用Clip Wrapping封裝映射方式對(duì)音視頻數(shù)據(jù)幀進(jìn)行定位分割及合并操作。因此,先對(duì)文件進(jìn)行讀取,查看是否屬于MXF文件;其次,當(dāng)文件為多個(gè)Body Partition時(shí),則從尾讀取至Partition Pack起點(diǎn)位置,當(dāng)文件為單個(gè)時(shí),則依次序讀取,并對(duì)Header Partition進(jìn)行依次序分析,并確定Essence Container的位置;再次,根據(jù)Header Metadata給出的信息,對(duì)格式、生成方式、素材輸入時(shí)間等信息進(jìn)行音視頻確認(rèn);最后,對(duì)音視頻數(shù)據(jù)幀進(jìn)行定位分割及合并操作。由于數(shù)字音頻數(shù)據(jù)編碼方式為KLV組織,使素材檢索定位效率獲得了提高。在進(jìn)行Clip Wrapping封裝時(shí),視頻所有幀數(shù)依次一幀緊接一幀靠在一起作為Picture Item放置到通用媒體容器中。對(duì)幀的定位順序?yàn)椋築ody Partition、Picture Item的位置,以及視頻幀在Picture Item的位置,并取出。而音頻數(shù)據(jù)與視頻數(shù)據(jù)讀取的方式相類似,由于數(shù)據(jù)重要放置在Sound Item中,因此,讀取的時(shí)候,只需要一次讀取1s或Ns的采樣數(shù)據(jù),封裝時(shí),因Sound Item中的數(shù)據(jù)量不夠,則需要從多個(gè)Sound Item中讀取音頻數(shù)據(jù)進(jìn)行分割合并,組成一個(gè)較大的數(shù)據(jù)緩沖,從而實(shí)現(xiàn)數(shù)字音頻碼流的無縫拼接。

視頻壓縮編碼技術(shù)有幀內(nèi)壓縮( Intra--frame ) 和幀間壓縮(Inter-frame)兩種, 音視頻素材在編輯過程中采用哪種壓縮方式?jīng)Q定了對(duì)素材進(jìn)行分割與合并的難度。幀內(nèi)壓縮一般是有損壓縮,針對(duì)每一幀圖像進(jìn)行壓縮,幀與幀之間沒有相互關(guān)聯(lián),在壓縮以后仍然可以以幀為單位進(jìn)行編輯,因此,在DV格式等非線性編輯領(lǐng)域常常會(huì)使這種壓縮方式。但是這種壓縮比率一般不高,為了要達(dá)到更高的壓縮比例就得使用幀間壓縮方式。幀間壓縮一般是無損壓縮,它通過比較相鄰兩幀之間的差異,在記錄時(shí)僅僅記錄本幀與相鄰幀的差值,這種壓縮方式減少了數(shù)據(jù)量,大大提高了壓縮的比率。在實(shí)際應(yīng)用中,兩種壓縮方式往往同時(shí)使用,MPEG-2編碼就同時(shí)具有幀內(nèi)壓縮與幀間壓縮兩種方式。

3 數(shù)字音視頻壓縮技術(shù)的實(shí)現(xiàn)

3.1 幀內(nèi)壓縮方式下的分割及合并

利用幀內(nèi)壓縮方式下的分割及合并技術(shù),只需要對(duì)分割文件偏移位置進(jìn)行確認(rèn)后,進(jìn)行重新編寫新的文件,所修改分割合并后的新音視頻素材文件就能夠正常進(jìn)行播放。下面主要針對(duì)DV、AVCI兩類采用幀內(nèi)壓縮方式的素材進(jìn)行分析。其具體分割流程如圖2所示:

合并的實(shí)現(xiàn)過程與分割過程基本相同,素材的合并主要是針對(duì)格式以及參數(shù)相同的兩個(gè)素材而言。

3.2 幀間壓縮方式下的分割及合并

幀間壓縮方式具有壓縮效率高、速度快等優(yōu)點(diǎn),但對(duì)素材的分割與合并不能簡單的找到相應(yīng)幀的位置進(jìn)行操作。我們將采用幀類型變換的方法對(duì)幀間壓縮的素材進(jìn)行分割。以MPEG-4格式為例,首先把MP4文件分解成視頻數(shù)據(jù)MPEG-4 video ES和 音頻數(shù)據(jù)MPEG-4 audioAAC。由于MPEG-4 文件中沒有各幀對(duì)應(yīng)的時(shí)碼信息,沒有分割MXF文件時(shí)直接供參考幀的絕對(duì)時(shí)碼,因此需先依據(jù)原素材文件的開始時(shí)碼即入點(diǎn)和出點(diǎn)來計(jì)算出對(duì)應(yīng)的幀序號(hào),然后根據(jù)幀頭分別找到入點(diǎn)和出點(diǎn)對(duì)應(yīng)的幀偏移。合并技術(shù)的重點(diǎn)在于實(shí)現(xiàn)各個(gè)素材片段的重排序以及無縫合并,實(shí)現(xiàn)音視頻重同步效果。

綜上所述,數(shù)字音視頻壓縮技術(shù)主要是為了能夠在原音視頻素材上,有效縮短任務(wù)時(shí)間快速對(duì)幀進(jìn)行定位訪問,并根據(jù)幀的位置,實(shí)現(xiàn)數(shù)字音視頻素材編輯的無縫拼接。以確保數(shù)字音視頻素材在經(jīng)過壓縮以后,依然具有完整性、可再編輯性。目前針對(duì)多種應(yīng)用環(huán)境下的音視頻碼流素材的分割、合并技術(shù)的研究也正在進(jìn)行,對(duì)數(shù)字音視頻的高效長遠(yuǎn)的發(fā)展有著很大的意義。

參考文獻(xiàn)

[1] 龔聲蓉,王朝暉.結(jié)合視頻分割的形狀編碼算法[A].蘇州市自然科學(xué)優(yōu)秀學(xué)術(shù)論文匯編,2010.

[2] 張曉萌,劉云,陳潛.嵌入式音視頻碼流合并系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)應(yīng)用,2011.

[3]張文豐.MPEG-2音視頻碼流合成與轉(zhuǎn)換技術(shù)的研究和實(shí)現(xiàn)[D].電子科技大學(xué),2006.

第5篇

由於在現(xiàn)今資訊流通普遍的社會(huì)中,影像的需求量越來越大,影像的數(shù)位化是必然的趨勢(shì)。然而在數(shù)位化過的影像所占的資料量又相當(dāng)龐大,在傳輸與處理上皆有所不便。將資料壓縮是最好的方法。如今有一新的模式,在壓縮率及還原度皆有不錯(cuò)的表現(xiàn),為其尚未有一標(biāo)準(zhǔn)的格式,故在應(yīng)用上尚未普及。但在不久的未來,其潛力不可限量。而影像之於印刷有密不可分的關(guān)系。故以此篇文章介紹小波(WAVELET)轉(zhuǎn)換的歷史淵源。小波轉(zhuǎn)換的基礎(chǔ)原理?,F(xiàn)今的發(fā)展對(duì)印刷業(yè)界的沖擊。影像壓縮的未來的發(fā)展。

壹、前言

由於科技日新月異,印刷已由傳統(tǒng)印刷走向數(shù)位印刷。在數(shù)位化的過程中,影像的資料一直有檔案過大的問題,占用記憶體過多,使資料在傳輸上、處理上都相當(dāng)?shù)馁M(fèi)時(shí),現(xiàn)今個(gè)人擁有TrueColor的視訊卡、24-bit的全彩印表機(jī)與掃描器已不再是天方夜譚了,而使用者對(duì)影像圖形的要求,不僅要色彩繁多、真實(shí)自然,更要搭配多媒體或動(dòng)畫。但是相對(duì)的高畫質(zhì)視覺享受,所要付出的代價(jià)是大量的儲(chǔ)存空間,使用者往往只能眼睜睜地看著體積龐大的圖檔占掉硬碟、磁帶和光碟片的空間;美麗的圖檔在親朋好友之間互通有無,是天經(jīng)地義的事,但是用網(wǎng)路傳個(gè)640X480TrueColor圖形得花3分多鐘,常使人哈欠連連,大家不禁心生疑慮,難道圖檔不能壓縮得更小些嗎?如此報(bào)業(yè)在傳版時(shí)也可更快速。所以一種好的壓縮格式是不可或缺的,可以使影像所占的記憶體更小、更容易處理。但是目前市場(chǎng)上所用的壓縮模式,在壓縮的比率上并不理想,失去壓縮的意義。不然就是壓縮比例過大而造成影像失真,即使數(shù)學(xué)家與資訊理論學(xué)者日以繼夜,卯盡全力地為lossless編碼法找出更快速、更精彩的演算法,都無可避免一個(gè)尷尬的事實(shí):壓縮率還是不夠好。再說用來印刷的話就造成影像模糊不清,或是影像出現(xiàn)鋸齒狀的現(xiàn)象。皆會(huì)造成印刷輸出的問題。影像壓縮技術(shù)是否真的窮途末路?請(qǐng)相信人類解決難題的潛力是無限的。既然舊有編碼法不夠管用,山不轉(zhuǎn)路轉(zhuǎn),科學(xué)家便將注意力移轉(zhuǎn)到WAVELET轉(zhuǎn)換法,結(jié)果不但發(fā)現(xiàn)了滿意的解答,還開拓出一條光明的坦途。小波分析是近幾年來才發(fā)展出來的數(shù)學(xué)理論。小波分析,無論是作為數(shù)學(xué)理論的連續(xù)小波變換,還是作為分析工具和方法的離散小波變換,仍有許多可被研究的地方,它是近幾年來在工具及方法上的重大突破。小波分析是傅利葉(Fourier)分析的重要發(fā)展,他保留了傅氏理論的優(yōu)點(diǎn),又能克服其不足之處??蛇_(dá)到完全不失真,壓縮的比率也令人可以接受。由於其數(shù)學(xué)理論早在1960年代中葉就有人提出了,而到現(xiàn)在才有人將其應(yīng)用於實(shí)際上,其理論仍有相當(dāng)大的發(fā)展空間,而其實(shí)際運(yùn)用也屬剛起步,其後續(xù)發(fā)展可說是不可限量。故研究的動(dòng)機(jī)便由此而生。

貳、WAVELET的歷史起源

WAVELET源起於JosephFourier的熱力學(xué)公式。傅利葉方程式在十九世紀(jì)初期由JosephFourier(1768-1830)所提出,為現(xiàn)代信號(hào)分析奠定了基礎(chǔ)。在十九到二十世紀(jì)的基礎(chǔ)數(shù)學(xué)研究領(lǐng)域也占了極重要的地位。Fourier提出了任一方程式,甚至是畫出不連續(xù)圖形的方程式,都可以有一單純的分析式來表示。小波分析是近幾年來才發(fā)展出來的數(shù)學(xué)理論為傅利葉方程式的延伸。

小波分析方法的提出可追溯到1910年Haar提出的小波規(guī)范正交基。其後1984年,法國地球物理學(xué)J.Morlet在分析地震波的局部性質(zhì)時(shí),發(fā)現(xiàn)傳統(tǒng)的傅利葉轉(zhuǎn)換,難以達(dá)到其要求,因此引進(jìn)小波概念於信號(hào)分析中,對(duì)信號(hào)進(jìn)行分解。隨後理論物理學(xué)家A.Grossman對(duì)Morlet的這種信號(hào)根據(jù)一個(gè)確定函數(shù)的伸縮,平移系{a-1/2Ψ[(x-b)/a];a,b?R,a≠0}展開的可行性進(jìn)行了研究,為小波分析的形成開了先河。

1986年,Y.Meyer建構(gòu)出具有一定衰減性的光滑函數(shù)Ψj,k(x),其二進(jìn)制伸縮與平移系{Ψj,k(x)=√2jΨ(2jx-k);j,k?Z}構(gòu)成L2(R)的規(guī)范正交基。1987年,Mallat巧妙的將多分辨分析的思想引入到小波分析中,建構(gòu)了小波函數(shù)的構(gòu)造及信號(hào)按小波轉(zhuǎn)換的分解及重構(gòu)。1988年Daubechies建構(gòu)了具有正交性(Orthonormal)及緊支集(CompactlySupported);及只有在一有限區(qū)域中是非零的小波,如此,小波分析的系統(tǒng)理論得到了初步建立。

三、WAVELET影像壓縮簡介及基礎(chǔ)理論介紹

一、WAVELET的壓縮概念

WAVELET架在三個(gè)主要的基礎(chǔ)理論之上,分別是階層式邊碼(pyramidcoding)、濾波器組理論(filterbanktheory)、以及次旁帶編碼(subbandcoding),可以說wavelettransform統(tǒng)合了此三項(xiàng)技術(shù)。小波轉(zhuǎn)換能將各種交織在一起的不同頻率組成的信號(hào),分解成不相同頻率的信號(hào),因此能有效的應(yīng)用於編碼、解碼、檢測(cè)邊緣、壓縮數(shù)據(jù),及將非線性問題線性化。良好的分析局部的時(shí)間區(qū)域與頻率區(qū)域的信號(hào),彌補(bǔ)傅利葉轉(zhuǎn)換中的缺失,也因此小波轉(zhuǎn)換被譽(yù)為數(shù)學(xué)顯微鏡。

WAVELET并不會(huì)保留所有的原始資料,而是選擇性的保留了必要的部份,以便經(jīng)由數(shù)學(xué)公式推算出其原始資料,可能不是非常完整,但是可以非常接近原始資料。至於影像中什度要保留,什麼要舍棄,端看能量的大小儲(chǔ)存(跟波長與頻率有關(guān))。以較少的資料代替原來的資料,達(dá)到壓縮資料的目的,這種經(jīng)由取舍資料而達(dá)到壓縮目地的作法,是近代數(shù)位影像編碼技術(shù)的一項(xiàng)突破。即是WAVELET的概念引入編碼技術(shù)中。

WAVELET轉(zhuǎn)換在數(shù)位影像轉(zhuǎn)換技術(shù)上算是新秀,然而在太空科技早已行之有年,像探測(cè)衛(wèi)星和哈柏望遠(yuǎn)鏡傳輸影像回地球,和醫(yī)學(xué)上的光纖影像,早就開始用WAVELET的原理壓縮/還原影像資料,而且有壓縮率極佳與原影重現(xiàn)的效果。

以往lossless的編碼法只著重壓縮演算法的表現(xiàn),將數(shù)位化的影像資料一絲不漏的送去壓縮,所以還原回來的資料和原始資料分毫無差,但是此種壓縮法的壓縮率不佳。將數(shù)位化的影像資料轉(zhuǎn)換成利於編碼的資料型態(tài),控制解碼後影像的品質(zhì),選擇適當(dāng)?shù)木幋a法,而且還在擷取圖形資料時(shí),先幫資料「減肥。如此才是WAVELET編碼法主要的觀念。

二、影像壓縮過程

原始圖形資料色彩模式轉(zhuǎn)換DCT轉(zhuǎn)換量化器編碼器編碼結(jié)束

三、編碼的基本要素有三點(diǎn)

(一)一種壓縮/還原的轉(zhuǎn)換可表現(xiàn)在影像上的。

(二)其轉(zhuǎn)換的系數(shù)是可以量化的。

(三)其量化的系數(shù)是可以用函數(shù)編碼的。

四、現(xiàn)有WAVELET影像壓縮工具主要的部份

(一)WaveletTransform(WAVELET轉(zhuǎn)換):將圖形均衡的分割成任何大小,最少壓縮二分之一。

(二)Filters(濾鏡):這部份包含WaveletTransform,和一些著名的壓縮方法。

(三)Quantizers(量化器):包含兩種格式的量化,一種是平均量化,一種是內(nèi)插量化,對(duì)編碼的架構(gòu)有一定的影響。

(四)EntropyCoding(熵編碼器):有兩種格式,一種是使其減少,一種為內(nèi)插。

(五)ArithmeticCoder(數(shù)學(xué)公式):這是建立在AlistairMoffat''''slineartimecodinghistogram的基礎(chǔ)上。

(六)BitAllocation(資料分布):這個(gè)過程是用整除法有效率的分配任何一種量化。

肆、WAVELET影像壓縮未來的發(fā)展趨勢(shì)

一、在其結(jié)構(gòu)上加強(qiáng)完備性。

二、修改程式,使其可以處理不同模式比率的影像。

三、支援更多的色彩??梢蕴幚鞷GB的色彩,像是YIQ、HUV的色彩定義都可以分別的處理。

四、加強(qiáng)運(yùn)算的能力,使其可支援更多的影像格式。

五、使用WAVELET轉(zhuǎn)換藉由消除高頻率資料增加速率。

六、增加多種的WAVELET。如:離散、零元樹等。

七、修改其數(shù)學(xué)編碼器,使資料能在數(shù)學(xué)公式和電腦的位元之間轉(zhuǎn)換。

八、增加8X8格的DCT模式,使其能做JPEG的壓縮。

九、增加8X8格的DCT模式,使其能重疊。

十、增加trelliscoding。

十一、增加零元樹。

現(xiàn)今已有由中研院委托國內(nèi)學(xué)術(shù)單位研究,也有不少的研究所的碩士。國外更是如火如荼的展開研究。相信實(shí)際應(yīng)用於實(shí)務(wù)上的日子指日可待。

伍、影像壓縮研究的方向

1.輸入裝置如何捕捉真實(shí)的影像而將其數(shù)位化。

2.如何將數(shù)位化的影像資料轉(zhuǎn)換成利於編碼的資料型態(tài)。

3.如何控制解碼影像的品質(zhì)。

4.如何選擇適當(dāng)?shù)木幋a法。

5.人的視覺系統(tǒng)對(duì)影像的反應(yīng)機(jī)制。

小波分析,無論是作為數(shù)學(xué)理論的連續(xù)小波變換,還是作為分析工具和方法的離散小波變換,仍有許多可被研究的地方,它是近幾年來在工具及方法上的重大突破。小波分析是傅利葉(Fourier)分析的重要發(fā)展,他保留了傅氏理論的優(yōu)點(diǎn),又能克服其不足之處。

陸、在印刷輸出的應(yīng)用

WAVELET影像壓縮格式尚未成熟的情況下,作為印刷輸出還嫌太早。但是後續(xù)發(fā)展?jié)摿o窮,尤其在網(wǎng)路出版方面,其利用價(jià)值更高,WAVELET的出現(xiàn)就猶如當(dāng)時(shí)的JPEG出現(xiàn),在影像的領(lǐng)域中掀起一股旋風(fēng),但是WAVELET卻有JPEG沒有的優(yōu)點(diǎn),JPEG乃是失真壓縮,且解碼後復(fù)原程度有限,能在網(wǎng)路應(yīng)用,乃是由於電腦的解析度并不需要太高,就可辨識(shí)其圖形。而印刷所需的解析度卻需一定的程度。WAVELET雖然也是失真壓縮,但是解碼後卻可以還原資料到幾乎完整還原,如此的壓縮才有存在的價(jià)值。

有一點(diǎn)必須要提出的就是,并不是只要資料還原就可以用在印刷上,還需要有解讀其檔案的RIP,才能用於數(shù)位印刷上。等到WAVELET的應(yīng)用成熟,再發(fā)展其適用的RIP,又是一段時(shí)間以後的事了。

在網(wǎng)路出版上已經(jīng)有瀏覽器可以外掛讀取WAVELET檔案的軟體了,不過還是測(cè)試版,可是以後會(huì)在網(wǎng)路上大量使用,應(yīng)該是未來的趨勢(shì)。對(duì)於網(wǎng)路出版應(yīng)該是一陣不小的沖擊。

圖像壓縮的好處是在於資料傳輸快速,減少網(wǎng)路的使用費(fèi)用,增加企業(yè)的利潤,由於傳版的時(shí)間減少,也使印刷品在當(dāng)?shù)赜∷⒌目赡苄栽龈撸瑴p少運(yùn)費(fèi),減少開支,提高時(shí)效性,創(chuàng)造新的商機(jī)。

柒、結(jié)論

WAVELET的理論并不是相當(dāng)完備,但是據(jù)現(xiàn)有的研究報(bào)告顯現(xiàn),到普及應(yīng)用的階段,還有一段距離。但小波分析在信號(hào)處理、影像處理、量子物理及非線性科學(xué)領(lǐng)域上,均有其應(yīng)用價(jià)值。國內(nèi)已有正式論文研究此一壓縮模式。但有許多名詞尚未有正式的翻譯,各自有各自的翻譯,故研究起來倍感辛苦。但相信不久即會(huì)有正式的定名出現(xiàn)。這也顯示國內(nèi)的研究速度,遠(yuǎn)落在外國的後面,國外已成立不少相關(guān)的網(wǎng)站,國內(nèi)僅有少數(shù)的相關(guān)論文。如此一來國內(nèi)要使這種壓縮模式普及還有的等。正式使用於印刷業(yè)更是要相當(dāng)時(shí)間。不過對(duì)於網(wǎng)路出版仍是有相當(dāng)大的契機(jī),國內(nèi)仍是可以朝這一方面發(fā)展的。站在一個(gè)使用其成果的角度,印刷業(yè)界也許并不需要去了解其高深的數(shù)理理論。但是在運(yùn)用上,為了要使用方便,和預(yù)估其發(fā)展趨勢(shì),影像壓縮的基本概念卻不能沒有。本篇文章單純的介紹其中的一種影像壓縮模式,目的在為了使後進(jìn)者有一參考的依據(jù),也許在不久的將來此一模式會(huì)成為主流,到時(shí)才不會(huì)手足無措。

參考文獻(xiàn):

1.GeoffDavis,1997,WaveletImageCompressionConstructionKit,。

2.張維谷.小宇宙工作室,初版1994,影像檔寶典.WINDOWS實(shí)作(上),峰資訊股份有限公司。

3.張維谷.小宇宙工作室,初版1994,影像檔寶典.WINDOWS實(shí)作(下),峰資訊股份有限公司。

4.施威銘研究室,1994,PC影像處理技術(shù)(二)圖檔壓縮續(xù)篇,旗標(biāo)出版有限公司。

5.盧永成,民八十七年,使用小波轉(zhuǎn)換及其在影像與視訊編碼之應(yīng)用,私立中原大學(xué)電機(jī)工程學(xué)系碩士學(xué)位論文。

第6篇

JPEG2000是新一代的靜態(tài)圖像編碼國際標(biāo)準(zhǔn),與已有的JPEG標(biāo)準(zhǔn)相比,它可以提供更好的圖像質(zhì)量和更高的壓縮率,但其計(jì)算的復(fù)雜度也遠(yuǎn)高于JPEG算法。一般在處理JPEG 2000圖像時(shí),若欲將其圖像尺寸縮小,首先需由JPEG 2000解碼器處理,將JPEG 2000圖像解碼到空間域圖像后,在空間域里將圖像縮小至所需尺寸后,再經(jīng)JPEG 2000編碼器將圖像作編碼,最后得到尺寸縮小后的壓縮圖像。但是由于在空間域里使用圖像大小轉(zhuǎn)換方法來縮小JPEG 2000圖像,需要大量的計(jì)算量、繁雜的處理過程、以及占用大量的存儲(chǔ)空間。為了加快圖像尺寸轉(zhuǎn)換處理速度、降低計(jì)算復(fù)雜度、以及有效降低存儲(chǔ)空間占用,本論文提出一個(gè)快速的JPEG 2000圖像尺寸縮小轉(zhuǎn)換算法。流程如圖1。

在我們的快速JPEG 2000圖像尺寸縮小轉(zhuǎn)換方法中,首先將原始JPEG 2000圖像經(jīng)EBCOT解碼以及反量化步驟解出圖像的頻率域編碼信息后,再透過頻率域圖像尺寸縮小轉(zhuǎn)換方法,直接在頻率域里縮小圖像尺寸,最后再通過量化與EBCOT編碼等步驟,將圖像尺寸縮小后的圖像頻率域編碼信息編成JPEG 2000圖像。

本文所提的JPEG 2000圖像尺寸縮小轉(zhuǎn)換方法與空間域圖像大小轉(zhuǎn)換方法相比,所提的方法省掉反向小波轉(zhuǎn)換、反向色彩轉(zhuǎn)換、后置處理、前置處理、正向色彩轉(zhuǎn)換、以及正向小波轉(zhuǎn)換等六個(gè)步驟。由于所提的方法不需將頻率域編碼信息轉(zhuǎn)成空間域圖像,因此本論文所提的方法除了可更快速的轉(zhuǎn)換圖像大小外,也可省下存放空間域圖像內(nèi)容所需的存儲(chǔ)空間以及減少所需的計(jì)算量。

1 簡化JPEG 2000壓縮與解壓縮流程

在快速JPEG 2000圖像尺寸縮小轉(zhuǎn)換方法中,保留了EBCOT解碼、反量化、量化與EBCOT編碼等四個(gè)部分,主要原因說明如下:

1.1 EBCOT編/解碼 JPEG 2000編碼后的圖像會(huì)儲(chǔ)存成封包的格式,但封包并非以子頻帶為單位儲(chǔ)存,所以要取得各子頻帶的內(nèi)容,必須先經(jīng)過EBCOT解碼才行。再者本文的方法有可能需要對(duì)子頻帶再進(jìn)行小波轉(zhuǎn)換,因此EBCOT編/解碼過程不可省略。

1.2 量化與反量化 保留量化與反量化步驟的主要原因在于圖像經(jīng)由正向小波轉(zhuǎn)換后,會(huì)產(chǎn)生不同大小的子頻帶頻率信息,不同子頻帶頻率信息使用不同的量化步長值進(jìn)行量化。

子頻帶與量化步長值這兩者有相對(duì)應(yīng)關(guān)系,換句話說以具有7個(gè)子頻帶的JPEG 2000圖像而言,必須要有7個(gè)相對(duì)應(yīng)的量化步長值。而子頻帶與量化步長值所產(chǎn)生的數(shù)目與小波轉(zhuǎn)換的層數(shù)有關(guān),對(duì)于一個(gè)經(jīng)過m層小波轉(zhuǎn)換的影像,所具有的子頻帶數(shù)目Nsubbands計(jì)算公式為:Nsubbands=3×m+1,圖2所示為圖像經(jīng)由二次小波轉(zhuǎn)換后所產(chǎn)生的七個(gè)不同的子頻帶。

每個(gè)子頻帶的量化步長值都是由一組獨(dú)立的控制參數(shù)(ε,μ)決定,該組控制參數(shù)必須記錄于JPEG 2000碼流頭部,供譯碼端還原量化步長值使用。圖3所示為一張圖像經(jīng)過三次小波轉(zhuǎn)換后所產(chǎn)生的頻率域情況。

本文所提的頻率域圖像尺寸縮小方法會(huì)改變?cè)緢D像的小波轉(zhuǎn)換層數(shù),進(jìn)而影響到量化步長值與子頻帶的對(duì)應(yīng)關(guān)系。當(dāng)使用不同小波轉(zhuǎn)換層數(shù)時(shí),每個(gè)子頻帶的量化步長值會(huì)不同。所以,當(dāng)圖像在進(jìn)行尺寸縮小前,先使用原本JPEG 2000圖像的量化步長值對(duì)圖像進(jìn)行反量化,還原頻率域信息,當(dāng)圖像尺寸已調(diào)整縮小后,再用新的量化步長值來量化頻率域信息,即可解決量化步長值與子頻帶不一致的問題。

在我們所提的方法中,分別會(huì)遇到小波層數(shù)足夠與小波層數(shù)不足的情況。假設(shè)一張JPEG 2000圖像小波層數(shù)為m層,欲要將圖像尺寸縮小為原來的(1/2n×1/2n)大小時(shí),假如n

若n>=m發(fā)生,也就是小波層數(shù)不足。首先經(jīng)EBCOT解碼后,產(chǎn)生不同的子頻帶信息。針對(duì)不同的子頻帶信息使用反量化,接著進(jìn)行圖像縮小的工作,將不需要的外頻信息去除,保留的頻率信息因小波層數(shù)不足(小波層數(shù)需為1層以上),要對(duì)保留的頻率信息再進(jìn)行小波轉(zhuǎn)換。產(chǎn)生出來的小波頻率域尺寸大小超過欲轉(zhuǎn)換尺寸,可將外頻的小波頻率信息去除,保留LL子頻帶。此時(shí)圖像大小雖已符合轉(zhuǎn)換所需大小,但JPEG 2000規(guī)定圖像至少要有一層小波轉(zhuǎn)換,所以必須再做一次小波轉(zhuǎn)換,得到一張小波轉(zhuǎn)換層數(shù)為1的JPEG 2000圖像,最后再經(jīng)量化與EBCOT編碼,得到尺寸縮小后的JPEG 2000圖像。

2 頻率域圖像尺寸縮小轉(zhuǎn)換方法

圖1中間的頻率域圖像尺寸縮小轉(zhuǎn)換方法主要工作包括縮小頻率域圖像尺寸與修改JPEG 2000圖像碼流主標(biāo)頭相關(guān)參數(shù)等步驟,詳細(xì)步驟如下:

2.1 括縮小頻率域圖像尺寸

①小波轉(zhuǎn)換層數(shù)足夠的作法。假設(shè)當(dāng)圖像的小波層數(shù)為m層,欲將圖像尺寸縮小為(1/2n×1/2n)大小時(shí),若n

首先使用EBCOT解出頻率域信息,再對(duì)需保留的頻率域信息作反量化動(dòng)作,接著將整張圖像的尺寸縮小,并且丟棄不需要的外頻頻率信息,最后將所保留的頻率域信息再重新經(jīng)過量化與EBCOT編碼,即可得到圖像尺寸縮小后的JPEG 2000圖像。

②小波轉(zhuǎn)換層數(shù)不足的作法。假設(shè)當(dāng)圖像的小波層數(shù)為m層時(shí),欲將圖像尺寸縮小為(1/2n×1/2n)大小時(shí),若n>=m,就是小波層數(shù)不足,則除了丟棄m個(gè)外層的中高頻信息外,還需要將原來最內(nèi)層的低頻信息,進(jìn)行(n-m)+1次小波轉(zhuǎn)換,再將所產(chǎn)生的(n-m)層的中高頻信息丟棄。由于以上的(n-m)次小波轉(zhuǎn)換后的中高頻信息最終將被丟棄,因此在進(jìn)行以上小波轉(zhuǎn)換時(shí)可直接省略許多計(jì)算工作,不必進(jìn)行完整的小波轉(zhuǎn)換。此法為本文提出的快速小波轉(zhuǎn)換方法。

2.2 修改JPEG 2000圖像碼流主標(biāo)頭相關(guān)參數(shù) JPEG 2000圖像碼流主標(biāo)頭記錄原始圖像大小、塊狀(tile)大小、小波層數(shù)、各子頻帶的量化步階值參數(shù)(ε和μ)等數(shù)據(jù)信息。在我們所提方法中,并沒有將圖像解回空間域,而是在頻率域信息縮小圖像尺寸后,直接進(jìn)行量化和EBCOT編碼,產(chǎn)生新的JPEG 2000圖像。新的JPEG 2000圖像碼流主標(biāo)頭數(shù)據(jù)無法像空間域轉(zhuǎn)換方法由JPEG 2000壓縮方式設(shè)定,而必須自行修改JPEG 2000圖像碼流主標(biāo)頭內(nèi)的相關(guān)參數(shù)。

3 小結(jié)

JPEG 2000具有的多種特性使其有著廣泛的應(yīng)用前景。目前許多圖形圖像公司如Pegasus,Aware等在開發(fā)的圖像軟件中集成了JPEG 2000圖像壓縮技術(shù);有的公司如ImagePower等已開發(fā)出JPEG 2000的DSP芯片。JPEG 2000將取代JPEG在圖像壓縮領(lǐng)域發(fā)揮重要作用。本論文提出一個(gè)新的快速圖像壓縮方法,可 大幅降低使用空間域轉(zhuǎn)換時(shí)的處理時(shí)間,以及所需存儲(chǔ)空間,但是本文所提方法只針對(duì)靜態(tài)圖像實(shí)現(xiàn)固定大小的縮小轉(zhuǎn)換,無法對(duì)圖像作任意大小轉(zhuǎn)換,對(duì)圖像作任意大小轉(zhuǎn)換是一個(gè)很好的發(fā)展方向,需作進(jìn)一步研究。

參考文獻(xiàn):

[1]杜偉娜,孫軍,倪強(qiáng).基于JPEG2000的高效率控制算法[J].上海交通大學(xué)學(xué)報(bào),2006,40(1):16-19.

第7篇

查看更多《信息技術(shù)》雜志社信息請(qǐng)點(diǎn)擊: 《信息技術(shù)》編輯部

      基金項(xiàng)目

        (1)基于c++ builder的共焦顯微鏡三維重建方法 楊召雷 張運(yùn)波 董洪波

        (4)m—link在通信系統(tǒng)仿真中的設(shè)計(jì)與實(shí)現(xiàn) 姚云龍 周俊 劉強(qiáng)

        (8)基于嵌入式的無線煤炭自燃預(yù)警系統(tǒng) 劉德文 杜宇人

        (11)tts語音單元的無損壓縮與按需解壓縮技術(shù) 卡斯木江·卡迪爾 古麗娜爾·艾力 艾斯卡爾·艾木都拉

        無

        (14)2012年中國國際信息通信展覽會(huì)開幕 無

        基金項(xiàng)目

        (15)低載荷工業(yè)機(jī)器人運(yùn)動(dòng)學(xué)分析與仿真 陳蓓玉 胡凱 楊樂

        (19)基于zigbee無線傳感網(wǎng)絡(luò)監(jiān)測(cè)系統(tǒng)的實(shí)現(xiàn) 楊俊 阮超 陳?,?付紅橋

        (23)endnote x5軟件在論文撰寫過程中的應(yīng)用 程宏輝 程筱農(nóng) 奚和平 黃新

        (26)一種近距離無線傳感器系統(tǒng)的設(shè)計(jì) 葉天鳳 胡長暉 葉夢(mèng)君 萬里光

        (29)sakai網(wǎng)絡(luò)教學(xué)平臺(tái)統(tǒng)一身份認(rèn)證中心的實(shí)現(xiàn) 柯水洲 馬雪梅 王新舸 鄒剛

        (33)增益連續(xù)可調(diào)寬帶前置放大電路設(shè)計(jì)與實(shí)現(xiàn) 汪俊杰 蓋建新 劉旭 程爽

        (37)actionscript3.0垃圾回收機(jī)制及優(yōu)化策略 李智勇

        (40)基于彩信的遠(yuǎn)程控制寵物籠系統(tǒng)的研制 楊樂 高超

        (42)spring mvc技術(shù)分析及在實(shí)踐教學(xué)系統(tǒng)中的應(yīng)用 符紅霞

        (47)支持向量機(jī)在廣義預(yù)測(cè)控制中的應(yīng)用 張偉 賈蓉

        (50)測(cè)控信息技術(shù)領(lǐng)域提高學(xué)生實(shí)踐創(chuàng)新能力的方法 王可寧 劉纏牢 王偉 張雄星

        (53)一種復(fù)雜背景下車牌定位算法 趙大偉 陳剛

        研究與探討

        (58)基于spce061a的語音手動(dòng)雙控制開關(guān)的設(shè)計(jì) 李建新 張肖飛 徐麗妍

        (62)基于bp神經(jīng)網(wǎng)絡(luò)的鉆井復(fù)雜情況和事故診斷 崔猛 汪海閣 李洪 紀(jì)國棟 于洋

        無

        (65)第九屆通信企業(yè)管理現(xiàn)代化創(chuàng)新成果審定會(huì)開幕 無

        研究與探討

        (66)一種基于單攝像頭的虛擬鍵盤 楊騁

        (68)基于橢圓曲線的充值卡加密 孫傳亮 周海港

        (72)基于ccd和光電編碼器的差速整定方法研究 李增彥 張迪洲 張男

        (77)嵌入式軟件仿真測(cè)試平臺(tái)開發(fā) 林丹丹

        (80)基于anybus-s pn io模塊的profinet遠(yuǎn)程i/o設(shè)計(jì) 楊明 王永剛 張陸毅

        (85)采用mel倒譜參數(shù)的咳嗽聲識(shí)別方法 尹永 莫鴻強(qiáng)

        (92)模板匹配算法的兩種實(shí)現(xiàn)方法比較 謝方方 楊文飛 陳靜 李芳 于越

        (96)基于msp430的低頻信號(hào)分析儀設(shè)計(jì) 張君 李金龍 郭建強(qiáng) 楊林曉

        (101)基于labview的雙向智能鑰匙充放電測(cè)試系統(tǒng) 尹武 張文娟 周繼宇

br>        (104)多用途市電負(fù)載功率調(diào)功電路的設(shè)計(jì) 姚正武 部紹海 林濤 李樹偉

        (107)gps周跳探測(cè)與修復(fù)方法的比較分析 徐歡 唐亮 都業(yè)濤

        (112)并行計(jì)算技術(shù)綜述 王磊

        (116)衛(wèi)星遠(yuǎn)程監(jiān)視及實(shí)時(shí)故障診斷研究與應(yīng)用 陳懷木 賈銀山 穆友勝

        (121)基于soa的一體化繳費(fèi)接入管理平臺(tái)設(shè)計(jì) 王樹全 鄒寧峰 金鑫

        (125)基于增量式pid控制算法的智能車設(shè)計(jì) 肖文健 李永科

        應(yīng)用技術(shù)

        (128)油層保護(hù)模糊專家系統(tǒng)的分析與設(shè)計(jì) 張丹 曹謝東 魏存擋 龐揚(yáng)

        (131)基于multisim10低頻信號(hào)源的設(shè)計(jì)與仿真 蘭羽 周茜

        (134)光電池基本特性的測(cè)定 趙楠 孫雪萍 李平舟

        (137)基于單片機(jī)的無視頻報(bào)警監(jiān)測(cè)儀設(shè)計(jì) 李釗

        (140)基于hfss的有孔屏蔽體的屏蔽效能分析 陳新平 楊顯清

        (144)戰(zhàn)術(shù)無線電臺(tái)半實(shí)物仿真系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn) 張愛民 辛廣輝 鄭振華

        (147)基于混合高斯模型與核密度估計(jì)的目標(biāo)檢測(cè) 呂游 任政 李向陽 方向忠

        (151)基于業(yè)務(wù)流程的信息化建設(shè)與應(yīng)用 劉光偉

        (153)基于國產(chǎn)cpu的嵌入式醫(yī)療電子無線網(wǎng)絡(luò)設(shè)計(jì) 裴家俊 張輝 劉蕓 戎蒙恬

        (157)利用vba及office自動(dòng)化技術(shù)輔助人事辦公 王晶

        (159)數(shù)字鐘電路的設(shè)計(jì) 曹嘯敏

        (163)基于電磁傳感器的智能車自主尋跡系統(tǒng)設(shè)計(jì) 師克 王洪軍 李永科

        無

        (166)上海市中國軟件名城創(chuàng)建暨軟件產(chǎn)業(yè)工作會(huì)召開 無

        應(yīng)用技術(shù)

        (167)異步時(shí)鐘亞穩(wěn)態(tài)仿真方法 高文輝 胥志毅 鄔天愷 劉文江 仲景尼

        (170)lwip的移植及其在并行系統(tǒng)中的應(yīng)用 趙虎 黎英 游謙

        (173)盲人行走輔助裝置中道路檢測(cè)算法的研究 徐姍姍 應(yīng)捷 宋彥斌

        無

        (176)尚冰出席第八屆中國信息無障礙論壇開幕式并致辭 無

        應(yīng)用技術(shù)

        (177)多載波傳輸系統(tǒng)的頻偏及采樣鐘聯(lián)合補(bǔ)償算法 李炎 周志平 李鑫

        (181)智能小車模糊-pid控制調(diào)速系統(tǒng)設(shè)計(jì) 張家驊 徐連強(qiáng) 吳迎春

        無

        (183)第九屆海峽兩岸信息產(chǎn)業(yè)和技術(shù)標(biāo)準(zhǔn)論壇舉行 無

        綜述與評(píng)論

        (184)epc信息管理系統(tǒng)在裝備器材保障中的研究 康帥 高慶 程遠(yuǎn)增

        (187)基于供應(yīng)鏈信息共享的備件資源整合研究 黃健 程中華 王亞彬

        (190)航空航天偵察情報(bào)保障能力綜合評(píng)價(jià)模型研究 童濤 楊桄 譚海峰 王壽彪 葉怡

        (194)裝備保障信息評(píng)價(jià)研究 趙國存 劉占嶺

        無

        (f0003)

第8篇

關(guān)鍵詞:KVM-OVER-IP;H.26X;MPEG;RLE(游程編碼)

中圖分類號(hào):TP368 文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2011)31-0000-00

Video Compression in the Network about Management of Server

FENG Zhan, WU Xin-jun

(Jiangnan Institute of Computing Technology, Wuxi 214128, China)

Abstract: the video compression technology in the server management plays a decisive role, this paper first introduced the current main video compression technology development, the application fields and standards, then for low cost, low power consumption demand, and proposes an improved RLE algorithm.

Key words: KVM-OVER-IP; H.26 X; MPEG; RLE(the run-length coding)

隨著服務(wù)器管理技術(shù)的發(fā)展,大部分的廠商都實(shí)現(xiàn)了服務(wù)器的遠(yuǎn)程網(wǎng)絡(luò)管理。使用者不必親臨現(xiàn)場(chǎng)便能處理發(fā)生的各種問題,極大的提高了服務(wù)器管理的效率。在服務(wù)器管理的硬件管理方案中KVM-OVER-IP的應(yīng)用最為廣泛。KVM實(shí)現(xiàn)遠(yuǎn)程桌面,虛擬設(shè)備、遠(yuǎn)程安裝OS鏡像等。一般的KVM卡內(nèi)嵌了瀏覽器,在客戶端通過web網(wǎng)頁直接訪問控制界面。

1 KVM-OVER-IP

在KVM over IP系統(tǒng)中,最大的挑戰(zhàn)來自于視頻信號(hào)的壓縮與傳輸。以分辨率1024x768,刷新率75Hz,32位真彩顯示輸出為例,其信號(hào)傳輸帶寬高達(dá)1.75Gb/sec,遠(yuǎn)遠(yuǎn)高于局域網(wǎng)及廣域網(wǎng)所能提供的傳輸帶寬。實(shí)用的KVM over IP系統(tǒng)需要在局域網(wǎng)中,提供高于1500:1的視頻壓縮比率;在廣域網(wǎng)中,提供高于6000:1的壓縮比率;同時(shí),KVM over IP系統(tǒng)必須在實(shí)現(xiàn)高比率視頻壓縮的同時(shí),在客戶端提供足夠清晰的視頻還原。其中,幀間比對(duì)與數(shù)據(jù)壓縮算法通常是各公司的專有技術(shù),也是直 接決定客戶端還原視頻質(zhì)量的重要因素。

2 目前主流的視頻壓縮算法

在視頻編解碼技術(shù)定義方面有兩大標(biāo)準(zhǔn)機(jī)構(gòu)。包括國際電信聯(lián)盟 (ITU) 和國際標(biāo)準(zhǔn)化組織 (ISO)。前者已經(jīng)開發(fā)了用于低比特率視頻電話的 H.26x 標(biāo)準(zhǔn),其中包括 H.261、H.262、H.263 與 H.264;主要針對(duì)電信領(lǐng)域的應(yīng)用,后者主要針對(duì)消費(fèi)類應(yīng)用,已經(jīng)針對(duì)運(yùn)動(dòng)圖像壓縮定義了 MPEG 標(biāo)準(zhǔn)。MPEG 標(biāo)準(zhǔn)包括 MPEG1、MPEG2 與 MPEG4。

圖1說明了視頻編解碼標(biāo)準(zhǔn)的發(fā)展歷程。

2.1 H.261

H.261[1]標(biāo)準(zhǔn)是1990年ITU制定的的第一個(gè)主流有損視頻壓縮標(biāo)準(zhǔn),設(shè)計(jì)的目的是能夠在帶寬為64kbps的倍數(shù)的綜合業(yè)務(wù)數(shù)字網(wǎng)(ISDN for Integrated Services Digital Network)上傳輸質(zhì)量可接受的視頻信號(hào)。編碼程序設(shè)計(jì)的碼率是能夠在40kbps到2Mbps之間工作,能夠?qū)IF和QCIF分辨率的視頻進(jìn)行壓縮編碼。

H.261原理是第一步是對(duì)采集的顯卡信號(hào)使用幀間預(yù)測(cè)來消除空域冗余,同時(shí)使用了運(yùn)動(dòng)矢量來進(jìn)行運(yùn)動(dòng)補(bǔ)償。隨后進(jìn)行變換編碼即采用使離散余弦變換(DCT)來進(jìn)一步的消除空域的冗余,然后對(duì)變換后的系數(shù)進(jìn)行量化,并量化后的變換系數(shù)進(jìn)行Zig-zag掃描來消除時(shí)域的冗余,最后使用熵編碼(可以使長度編碼或者是霍夫曼編碼)來消除統(tǒng)計(jì)冗余。但是H.261僅僅對(duì)視頻的解碼進(jìn)行了規(guī)定,而并沒有定義解碼器的實(shí)現(xiàn),因此在具體實(shí)現(xiàn)時(shí),研究者可以針對(duì)不同的應(yīng)用對(duì)數(shù)據(jù)進(jìn)行不同的預(yù)處理從而達(dá)到更好的效果,

2.2 MPEG-1

MPEG-1 [2] 是ISO 于1990年開發(fā)的第一個(gè)視頻和音頻有損壓縮標(biāo)準(zhǔn)。主要應(yīng)用是數(shù)字媒體上動(dòng)態(tài)圖像與音頻的存儲(chǔ)與檢索,如速率為 1.15Mbps、采用 SIF 分辨率(352′240-29.97fps 或者 352′288-25 fps)的VCD。MPEG-1在關(guān)鍵技術(shù)上做了一些改進(jìn),塊方式的運(yùn)動(dòng)補(bǔ)償,離散余弦變換,等技術(shù),隨后被Video CD采用為核心技術(shù)。 但是其缺點(diǎn)也比較明顯,雖然在速率上可以滿足很多應(yīng)用,但是壓縮比不夠大,作為實(shí)時(shí)視頻壓縮,需要的磁盤空間特別大,正是這一點(diǎn)也限制了它的應(yīng)用。

2.3 MPEG-2

MPEG-2 [3] 是ISO 于1994年制定的,主要針對(duì)于高級(jí)工業(yè)標(biāo)準(zhǔn)的圖像質(zhì)量以及更高的傳輸率。并且MPEG-2相比MPEG-1提供較廣范圍的壓縮比,已適用于對(duì)畫面質(zhì)量,存儲(chǔ)容量,以及帶寬要求不同的場(chǎng)合。MPEG-2主要用于DVD的標(biāo)準(zhǔn),還可用于為廣播,有線電視網(wǎng),電纜網(wǎng)絡(luò)以及衛(wèi)星直播(DirectBroadcastSatellite)提供廣播級(jí)的數(shù)字視頻。

2.4 H.263

H.263的開發(fā)主要是為了實(shí)現(xiàn)低碼流的通信。是在H.261的基礎(chǔ)上制定出來的,但實(shí)際上這個(gè)標(biāo)準(zhǔn)在很多方面做了改進(jìn),可用在很寬的碼流范圍。它在許多應(yīng)用中都可以取代H.261。H.263的編碼算法與H.261基本原理一樣,但做了一些改善和改變,以提高性能和糾錯(cuò)能力。H.263標(biāo)準(zhǔn)在低碼率下能夠提供比H.261更好的圖像效果,其特點(diǎn)包括以下幾點(diǎn):

1)H.263中的數(shù)據(jù)流層次結(jié)構(gòu)的某些部分是可選擇的,使得編解碼可以根據(jù)針對(duì)實(shí)際的應(yīng)用選擇數(shù)據(jù)率和糾錯(cuò)能力;

2)H.263的運(yùn)動(dòng)補(bǔ)償使用半像素精度,這與H.261相比提高了壓縮率;

3)H.263采用了基于空域的的幀內(nèi)預(yù)測(cè)方法;

4)H.263支持5種分辨率,即包括QCIF,CIF,SQCIF、4CIF,16CIF,其中SQCIF相當(dāng)于QCIF一半的分辨率,而4CIF和16CIF分別為CIF的4倍和16倍;

5)H.263采用了無限制的運(yùn)動(dòng)向量,允許運(yùn)動(dòng)矢量指向圖像以外的區(qū)域;

6)H.263采用了基于句法的算術(shù)編碼模式使用算術(shù)編碼代替霍夫曼編碼,可在信噪比和重建圖像質(zhì)量相同的情況下降低碼;。

7)H.263提高網(wǎng)絡(luò)適應(yīng)性,采用“網(wǎng)絡(luò)友好”的結(jié)構(gòu)和語法,加強(qiáng)對(duì)誤碼和丟包的處理,提高解碼器的差錯(cuò)恢復(fù)能力。

2.5 MPEG-4

MPEG-4[4] 是1998年11月公布的,MPEG-4標(biāo)準(zhǔn)主要應(yīng)用于視像電話(Video Phone),視像電子郵件(Video Email)和電子新聞(Electronic News)等,其傳輸速率要求較低,在4800-64000bits/sec之間,分辨率為176X144。MPEG-4利用很窄的帶寬,通過幀重建技術(shù),壓縮和傳輸數(shù)據(jù),以求以最少的數(shù)據(jù)獲得最佳的圖像質(zhì)量,但是其在服務(wù)器的領(lǐng)域沒有得到廣泛的應(yīng)用。

視頻編碼技術(shù)最重要的突破是由 ITU 和 ISO/IEC 的聯(lián)合視頻小組 (JVT) 開發(fā)的H.264/MPEG-4 AVC[5]標(biāo)準(zhǔn)。H.264/AVC[5] 在壓縮效率方面取得了巨大突破,H.264和H.261、H.263一樣,也是采用DCT變換編碼加DPCM的差分編碼,即混合編碼結(jié)構(gòu)。同時(shí),他采用了一些新的更有效率的技術(shù)如幀內(nèi)預(yù)測(cè)編碼,可變矢量塊大小。多參考幀預(yù)測(cè),自適應(yīng)環(huán)路去塊濾波器等。并且其在應(yīng)用方面有了更大的進(jìn)步:

1)H.264沒有繁瑣的選項(xiàng),而是力求簡潔的“回歸基本”,它具有比之前的壓縮標(biāo)準(zhǔn)更好的壓縮性能,又具有適應(yīng)多種信道的能力。

2)H.264的應(yīng)用目標(biāo)廣泛,可滿足各種不同速率、不同場(chǎng)合的視頻應(yīng)用,具有較好的抗誤碼和抗丟包的處理能力。

3)H.264的基本系統(tǒng)無需使用版權(quán),具有開放的性質(zhì),能很好地適應(yīng)IP和無線網(wǎng)絡(luò)的使用,這對(duì)目前因特網(wǎng)傳輸多媒體信息、移動(dòng)網(wǎng)中傳輸寬帶信息等都具有重要意義。

正是由于H.264的種種特點(diǎn),使得該算法標(biāo)準(zhǔn)一制定出來,便受到了廣泛的應(yīng)用,其優(yōu)秀的編解碼能力在視頻通信領(lǐng)域應(yīng)用的的也越來越多,盡管其復(fù)雜性也是之前視頻壓縮算法的數(shù)倍,但是集成電路的發(fā)展以及SOC技術(shù)的革新,這些已經(jīng)可以得到很好的解決。

隨著視頻壓縮算法的不斷更新,各大服務(wù)器廠商的的實(shí)現(xiàn)產(chǎn)品也不斷的革新,主要是針對(duì)不同的應(yīng)用場(chǎng)合采用不同的壓縮算法,然后結(jié)合所做的硬件部分進(jìn)行一些改進(jìn)和優(yōu)化。

3 改進(jìn)的RLE(游程)壓縮算法

本論文提出的視頻壓縮算法是一個(gè)低代價(jià),低功耗的可行算法,針對(duì)某種特定場(chǎng)合所使用的,雖然壓縮視頻的效果有待提高,但是能滿足基本的要求。本文的視頻壓縮是基于一個(gè)256M大小的FPGA上實(shí)現(xiàn)的,而且在該FPGA上還實(shí)現(xiàn)了一個(gè)嵌入式軟核,軟核的作用是實(shí)現(xiàn)BMC的調(diào)試,因此硬件資源有限,該視頻壓縮只能算該FPGA的一個(gè)模塊。因此涉及到太多乘法的算法難以實(shí)現(xiàn),考慮選擇RLE游程算法來實(shí)現(xiàn),該算法簡單容易實(shí)現(xiàn),其基本的思想是,利用數(shù)據(jù)之間的關(guān)聯(lián)性,而屏幕顯示的數(shù)據(jù),以整個(gè)像素為單位,關(guān)聯(lián)性是很強(qiáng)的,對(duì)一般常見的屏幕圖像使用RLE(游程編碼)算法進(jìn)行單幅圖像的壓縮,平均可以獲得30%到50%的壓縮效果,因此使用RLE算法是可行的。以現(xiàn)有的試驗(yàn)平臺(tái)的硬件條件來看,以太網(wǎng)是100Mbps。傳輸?shù)臄?shù)據(jù)占用1/5帶寬,因此傳輸?shù)臄?shù)據(jù)量有限,只能減少傳輸?shù)臄?shù)據(jù)量,降低傳送視頻的圖像數(shù)和視頻的壓縮質(zhì)量從而完成視頻的壓縮,根據(jù)人的視覺系統(tǒng)所能接受的范圍,本文以每秒10幅圖像來完成視頻的傳輸,這樣每幅圖像的壓縮數(shù)據(jù)應(yīng)該為256KB,而一幅未經(jīng)任何處理的1280X1024的圖像大小約為4MB,這樣壓縮效果必須達(dá)到原來圖像的1/8左右,因此必須對(duì)RLE算法進(jìn)行優(yōu)化,使得修改后的壓縮算法能夠保證數(shù)據(jù)的實(shí)時(shí)性傳輸,

由于視頻壓縮模塊接受的是顯卡輸出的像素?cái)?shù)據(jù),是以RGB形式接收的,本文實(shí)現(xiàn)的方法是對(duì)每個(gè)像素的后三位數(shù)據(jù)進(jìn)行四舍五入而后丟棄,這樣做得好處有兩方面:

1)可以增強(qiáng)相鄰像素的相關(guān)性從而加強(qiáng)壓縮的效率;

2)可以減少傳輸?shù)臄?shù)據(jù)總量;

然后再對(duì)得到的數(shù)據(jù)使用RLE壓縮方法,具體是實(shí)現(xiàn)時(shí)是以每行的大小來壓縮成一個(gè)數(shù)據(jù)包,然后通過以太網(wǎng)進(jìn)行傳輸,客戶端進(jìn)行解壓縮得到源圖像數(shù)據(jù)。雖然圖像有一定的失真,但是在可以接受的范圍內(nèi),通過在FPGA上測(cè)試,基本能達(dá)到1/10的壓縮率。

這種低功耗,低成本的視頻壓縮系統(tǒng),適用于小架構(gòu)的電子產(chǎn)品。例如低精度的小型攝像儀器,監(jiān)控系統(tǒng)等。

4 結(jié)束語

本文首先介紹了目前主流的視頻壓縮算法,以及適用的各種領(lǐng)域,而后提出一種改進(jìn)的RLE壓縮算法,主要應(yīng)用在小功耗的壓縮系統(tǒng)的中,雖然壓縮效果不是很好,但是容易實(shí)現(xiàn),而且其優(yōu)點(diǎn)也是很明顯的。

參考文獻(xiàn):

[1] ITU-T建議 H.261:,《用于 px64Kbps 音頻/視頻業(yè)務(wù)的視頻編解碼技術(shù)》.

[2] ISO/IEC 11172-2:,《1.5Mbps 數(shù)字存儲(chǔ)媒體的動(dòng)態(tài)圖像及相關(guān)音頻的編碼》.1993

[3] ISO/IEC 13818-2:,《動(dòng)態(tài)圖像及相關(guān)音頻信息的通用編碼:音頻》.1995

[4] SO/IEC 14496-2:,《信息技術(shù)――音頻/視頻對(duì)象的通用編碼》.2001

[5] Sullivan G,Wiegand T.“視頻壓縮――從概念到 H.264/AVC 標(biāo)準(zhǔn)”[J].IEEE學(xué)報(bào),2005(1).

優(yōu)秀范文