在線客服

編碼技術論文實用13篇

引論:我們為您整理了13篇編碼技術論文范文,供您借鑒以豐富您的創作。它們是您寫作時的寶貴資源,期望它們能夠激發您的創作靈感,讓您的文章更具深度。

編碼技術論文

篇1

1.2網絡編碼的構造方法

在對網絡編碼的研究當中最主要的一個問題就是結點要根據哪種方式對所接受的數據分組進行編碼組合。從目前的研究來看,學者從不同的角度對網絡編碼的構造方法進行了相應的分析探討,比如說采用的編碼系數選擇方式,分組編碼操作方式等方面,其具體的表現是根據編碼結點分組進行編碼操作的方式,其中線性網絡編碼主要表現是結點對所接受的數據分組實行的是線性編碼組合型操作,不然編碼的工程就會變為非線性網絡編碼。我們根據編碼系數的選擇方式,把網絡編碼構造的方法分為兩種,一種是確定性網絡編碼,另一種是隨機網絡編碼。這兩種編碼都有一定的好處,但是確定性網絡編碼構造方法的編碼系數是根據某一種算法進行確定的,而隨機網絡編碼中編碼系數是從伽羅符號中隨機進行選擇的,因此隨機網絡編碼構造方法在整個的網絡編碼系數選擇中占據著靈活性的地位,這也是隨機網絡編碼構造方法的特點。我們根據編碼在網絡系統中的具體實現過程,將網絡編碼分為了兩種編碼形式,一種是集中式網絡編碼,另一種是分布式網絡編碼。集中式網絡編碼是在編碼的過程當中需要了解全局的網絡拓撲,根據全局網絡的情況來分配相應的編碼系數,這一編碼形式并不適合拓撲變換較大的無線網絡。分布式網絡編碼僅僅需要了解網絡當中一部分拓撲信息就可以進行相應的編碼操作,而且分布式網絡編碼還具有較為良好的應用性能。

1.3網絡編碼應用網絡數據傳送的研究

網絡編碼是一種編碼和路由信息交換的技術,在傳統道德路由方法基礎上,通過對接收的多個分組進行相應的編碼信息融合,以達到增加單次傳輸信息量的作用,從而提高網絡的整體性能。網絡編碼最開始提出時是因為多播技術,網絡編碼最初是為了提高網絡多播的數據速率,而隨著網絡研究的不斷深入,使得網絡編碼在其他的領域也逐漸有了優勢,比如說提高網絡帶寬的利用率,從總體而言,對網絡編碼的應用在很大程度上提高了網絡的實際吞吐量,進一步的減少了數據分組的傳輸量,也在一定程度上降低了數據傳送的功耗,由此我們看出網絡編碼為網絡的數據傳送性能的改善提供了新的途徑。

1.4基于網絡編碼的數據傳送技術研究趨勢

隨著基于網絡編碼的數據通信技術研究的不斷深入,出現了很多新的理論,但是網絡編碼所面臨的問題也隨之增多,尤其是網絡編碼的網絡數據傳送技術問題,雖然經過近幾年的研究取得了一定的進展。但是仍然面臨著許多難題需要我們去逐一解決。

1)網絡編碼復雜度得到降低。

現階段最主要的一個問題就是怎樣在提高網絡編碼效率的同時降低網絡編碼的復雜程度。這會涉及到網絡編碼的相應網絡開銷,這也是作為網絡編碼性能評價的內容之一,還有就是在網絡編碼實用化的過程當中,逐漸控制網絡編碼的復雜程度,減少網絡編碼需要的額外的計算量,從而降低系統的實施成本。這對于網絡部署以及應用網絡編碼都具有非常重要的意義。

2)數據傳送可靠性研究。

保證網絡性能的一個主要方面就是提高網絡數據傳送的可靠性,現階段對網絡數據傳輸可靠性的網絡編碼研究主要是根據多徑路由展開的,這也在一定程度上對網絡編碼中的數據傳輸提供了可靠性。因此在多跳動態的網絡環境當中,分析研究提高網絡編碼數據傳送的可靠性具有很高的現實意義。

2基于網絡編碼的數據通信技術的相應解決方案

1)在對網絡編碼的網絡協議結構研究當中

其出發點主要向三個方面集中:一是較為系統的分析網絡編碼在各個協議層與現有協議相結合的參數,其目的是為了讓應用網絡編碼提高網絡的系統整體性能;二是設計相應的對應網絡性能指標的線性規劃模型,以便求解出線性規劃模型的最有設定;三是提高各個協議層之間的信息反饋機制來實現參數的實時調整。

2)在對網絡編碼時延約束控制的研究當中

針對數據在網絡中各個結點頻繁的參與編碼和解碼的操作,使得數據編碼時延逐漸成為了網絡數據傳送累積時延的主體,基于此種情況,我們在網絡編碼的實際應用當中,提出了基于數據傳送時延約束的網絡編碼模型,這一模型的出現在較大程度上對傳送時延進行了優化的控制;與此同時我們還引入了數據傳送信息反饋機制,以此來促進數據在網絡結點中的及時有效傳送。

篇2

目前,我國各高校的學位論文大部分都是用中文撰寫的,也有一小部分是用外文撰寫的。高校圖書館將學位論文收藏至自建特色數據庫,就需要對學位論文進行編目,對學位論文編目時要保證編目產生的關于學位論文的數據的質量,以方便讀者檢索并利用學位論文。

1 中文MARC編目學位論文存在的問題

高校圖書館對文獻資源進行有效的分類標引和主題標引,并用相應的著錄、編目格式使文獻資源的主要檢索項及特點形成書目的形式就是高校圖書館的編目工作[1]。學位論文編目的工作流程一般為:回溯編目―審校―典藏―貼書標―入庫上架。學位論文作為一種特殊的文獻資源,其編目具有自己的特點:1)編目難度高。高校大學生研究的學術領域及學術方向繁多,其具體研究方向小而專,對非專業編目人員來說,分類編目比較困難;2)編目工作量巨大。教育事業飛速發展,各高校每年都在擴大招生,進而各高校每年產出的學位論文數量激增,而高校圖書館編目人員有限,而且圖書館每年還要有其他書目入館需要編目,因此編目人員總的工作量非常大。3)學位論文撰寫語種不統一。部分高校設有外國語學院,這些學院的部分學生所撰寫的學位論文所使用的語種一般為外文。

中文MARC是以UNIMARC為基本依據,根據我國出版物的具體情況制定的[2]。中文MARC機讀記錄字段區有如下10個功能塊:0―標識塊;1―編碼信息塊;2―著錄信息塊;3―附注塊;4―款目連接塊;5―相關題名塊;6―主題分析塊;7―責任者塊;8―國際使用塊;9―國內使用塊[3]。中文MARC通過對每個功能塊增設功能不同的多種字段及子字段、對每個字段又增設不同要求的標識符的方式更為詳細的記錄文獻信息。

高校圖書館編目學位論文最終要達到的目標是:1)精準、全面、直觀的反映出學位論文所表達的科研成果,包括科研成果的領域,關鍵詞等信息。2)準確標引學位論文,形成規范數據,方便讀者進行檢索。編目學位論文是讀者可以使用學位論文的前提和基礎,學位論文編目工作的質量直接關系到讀者對學位論文的使用情

況[1]。因此,學位論文編目工作是高校圖書館工作中的一個重要分支,各高校對學位論文編目工作都很重視。但是由于學位論文本身具有的特殊性和中文MARC編目具有的高技術性,導致中文MARC在對學位論文進行編目的時候會出現一些問題,而這些問題的出現直接影響了學位論文編目的質量,進而影響到學位論文在高校圖書館乃至整個學術界的正常流通。中文MARC在高校圖書館學位論文編目中存在如下問題。

1)標準不統一。當前我國使用比較普遍的中文MARC編目標準有兩種:一種是國家圖書館編寫制定的全國圖書館聯合編目中心系統標準;一種是北京大學圖書館編寫制定的中國高等教育文獻資源保障系統,即CALIS系統標準[3]。雖然采用這兩種中文MARC編目標準編目的數據覆蓋面都很廣,共享性也比較強,但還是應該將這兩種標準結合,制定一套唯一的編目標準。有了唯一的標準,各高校圖書館在選擇編目系統時也不需要進行比較,既方便了高校圖書館編目工作,也能使圖書信息流通更順暢。

2)標引不規范?!吨袊鴪D書分類法》是高校圖書館編目分類的主要依據。由于部分高校圖書館還有自己編寫的《圖書館編目分類細則》,并結合這兩個規范來進行編目,因此在很多編目細則上出現了不一致現象。

3)著錄字段不完整。中文MARC編目雖然具有詳細的編目規則,但是不同的編目員對規則的理解會有所不同。在中文MARC著錄中,字段和指示符都有詳細的規定,如果出現指示符的漏著、錯著都會直接影響到學位論文的檢索。

4)外文語種撰寫的學位論文編目格式不統一。當前我國圖書館使用USMARC對外文圖書進行著錄,而有些圖書館認為只有原版外文書籍才應該用USMARC進行編目,其余外文圖書應該按中文MARC格式來著錄。因此,使用外文撰寫的學位論文編目格式就出現了兩種,即USMARC格式和中文MARC格式。這種不一致的編目格式會嚴重影響到學位論文的網上共享,對數字圖書館的建設也有不利影響。

高校圖書館每年進書量都很大,新進圖書只有經過編目才能入庫上架,讀者才能在館藏書目檢索系統中檢索到圖書,而高校圖書館專業的編目人員非常有限,因此就會出現非專業人員對圖書進行編目,比如燕山大學圖書館學位論文的編目工作就是由勤工助學的學生來完成的。編目工作對人員專業要求比較高,編目細則又非常繁雜,雖然專業的編目人員已經設定號學位論文編目格式,但是非專業人員在對學位論文進行編目的時候很容易就會出現漏著、錯著的現象,而在對學位論文編目中出現的錯誤只有非常專業的編目人員才能及時發現,這樣就會導致很多編目過程中出現的錯誤到最后都沒有被發現,從而影響到讀者對學位論文的檢索。

篇3

1 引言

目前最新的視頻編碼標準H.264/AVC[1]是由國際電信聯盟(ITU-T)的視頻編碼專家組(VCEG)和國際標準化組織(ISO/IEC)的運動圖像專家組(MPEG)建立的聯合視頻工作組(JVT)聯合制定的。在H.264/AVC標準中,為了獲得高視頻質量和高壓縮比,采用率失真優化 RDO (rate distortion optimization) 模型[2,3]選擇幀內預測模式,但幀內預測模式選擇算法的高計算復雜度是制約H.264/AVC實際應用的主要因素之一。幀內預測模式選擇的改進算法研究,成為近年來國內外研究的熱點。畢業論文,H.264/AVC?,F有的幀內預測模式選擇優化算法,大體可分為2類:1) 簡化 RDO代價函數[4];2)通過概率預測及閾值判斷來減少候選模式[5-7]。其中第2類方法吸引了更多研究者的關注。然而這些方法在提高編碼速度的同時,編碼性能都有所下降。

本文對多種序列的幀內編碼中各種預測模式所占比重進行統計,并基于統計結果提出了一種單向直接預測與多方向預測相結合的自適應算法。該算法對用于預測的參考像素進行相似度判斷,在參考像素相似度高時,直接使用DC預測模式進行預測,除了能省略編碼H.264/AVC中傳統的9種預測模式所需要的比特,還節省了傳統方法中需要進行的在9種模式之間進行擇優的運算過程。從而,在提高編碼性能的同時,減少了計算復雜度。

2 H.264/AVC幀內編碼過程

H.264/AVC使用幀內預測編碼技術以降低鄰近宏塊之間的空間相關性,它定義了9種4×4亮度塊預測模式,4種16×16亮度塊預測模式。編碼端采用率失真優化模式判決方法選擇最佳的幀內預測模式。本文主要針對H.264/AVC中4×4亮度塊的幀內預測編碼進行研究。4×4亮度的預模式除平均模式(模式2)以外,還有其它8種模式,它們具有不同的預測方向。圖1顯示了這8種模式的預測方向。

對于一個4×4塊而言,它需要用1個或4個比特表示編碼模式。在一個宏塊中,共有16個4×4子塊,共需要16到64個比特來表示編碼模式。畢業論文,H.264/AVC。在低碼率視頻編碼應用系統中,編碼幀內預測模式所需的比特在總碼流中占較大的比重。同時,遍歷H.264/AVC所定義的全部預測模式,并用率失真優化函數在其中擇優,需要較大的計算量。為了減少表示編碼模式所需的碼率,并提高編碼速度,我們提出利用參考像素的相似度來決定是否直接進行平均模式的預測編碼。

3 基于參考像素相似度檢測的幀內預測編碼

圖2為4×4待預測子塊及其參考像素,其中為待預測像素,為相鄰塊中的參考像素。從預測原理可知,當所有的參考像素都相同時,使用9種預測模式所得的預測值都相同。在這種情況下,使用這些模式進行預測所得到的殘差也相同。當不完全相同但非常近似時,考慮到量化步驟會將比較相近的殘差值量化為相同的值,我們也可以得出同樣的結論。因此,在上述情況下,我們默認使用一種固定的預測模式進行預測,不但可以省略標識預測模式所需要的碼流,還可以省略其余8種預測所進行的率失真決策計算量。

圖1. 4×4亮度塊的幀內預測模式圖2.預測塊及其參考像素

為了確定默認模式,我們選取多個CIF序列,對不同序列中各個預測模式的分布情況進行了統計分析,如表1所示。從表1可以得知,垂直、水平以及DC三種模式之和占所有預測模式的60%以上,其中DC模式占的比重最大。畢業論文,H.264/AVC。畢業論文,H.264/AVC。因此,為了適應參考像素比較相似的紋理特性,我們選擇DC模式作為默認模式。

篇4

在移動通信系統中,可以通過高階信號調制技術和多輸入多輸出(MIMO)技術來提高系統的頻譜效率,但是,在一個噪聲信道環境下,傳輸數據速率的提高會帶來誤碼率的提升。為了提高頻譜效率,長期演進(LTE)移動通信系統中采用了鏈路自適應技術,根據信道條件的變化,系統動態地采用不同的調制和編碼、MIMO傳輸模式[1]、預編碼和發射功率等技術,以期在保證信號質量的情況下取得最大的傳輸效率。

LTE移動通信系統采用了正交頻分多址(OFDMA)、多輸入多輸出(MIMO)[2]等關鍵技術,以此來克服多徑信道的頻率選擇性衰落和提高系統的傳輸速度。本文對LTE移動通信系統中預編碼算法進行了研究,并根據信道條件的變化,對鏈路自適應調制與編碼技術下的預編碼算法進行了性能仿真,分析了不同調制與編碼下系統的傳輸速率與誤碼率的曲線變化。

二、基于信道矩陣奇異值分解的預編碼算法

多輸入多輸出(MIMO)技術將連續的信號比特流拆分成多個信號子流,再將各信號子流通過不同的天線發射出去,傳輸各信號子流的多個發射天線與接收天線構成了空間信道矩陣。在空間信道矩陣構成的各子信道不相互獨立的情況下,各子信道將相互干擾,從而影響信號接收質量。在LTE系統中,預編碼技術被看作是解決空間各子信道相互干擾最有效的方法[3]。最優的預編碼矩陣是基于信道矩陣奇異值分解的矩陣。

首先假設在一個子幀持續時間內,信道矩陣H不變,假設系統有NT根發射天線,MR根接收天線,發射符號分為L層,每個層有T個符號,第i層由符號[xi,1,xi,2,...,xi,T]組成。對信道矩陣H進行奇異值分解:

式中,n為高斯白噪聲。在實際的應用中,由于反饋資源的限制,系統首先須在預先給定好的碼本里選擇一個碼本作為預編碼矩陣,也就是利用某種準則得到碼本索引。

三、預編碼矩陣下的MIMO接收機算法

LTE系統中的預編碼矩陣指示(PMI)反饋都是基于協議配置碼本,主要有兩種準則:一種是基于系統容量最大化,另一種是基于最小誤碼率(BER)[4]。本論文采用基于最小誤碼率的MMSE準則,減小發射信號和接收信號之間的誤差信號功率值,并以此自適應選擇不同的調制方式和編碼,以便保證系統取得最大的傳輸容量。假設均衡后的信號為X?,最初的發射信號為X,假定最優均衡器變換系數為G,MIMO信道矩陣為H,那么誤差信號可以表示為:

四、自適應調制與編碼技術下的預編碼算法仿真實驗

為了對算法性能作對比,在預編碼算法基礎上,自適應調制方式分別在QPSK、16QAM、64QAM三種方式進行選擇,接收端用MMSE準則的均衡器,將發射信號功率值與均衡后的誤差信號功率值的比值作為自適應調節參數,選擇相應的調制方式與編碼率,當誤差信號功率值較大時,此時誤碼率較大,選擇低階調制方式,以保證信號傳輸質量,當誤差信號功率值較小時,選擇高階調制方式,以提高信號的傳輸速率,以期在滿足信號質量要求的情況下達到最高的傳輸效率。

仿真實驗在多輸入多輸出MIMO的情況下展開,信號經過衰落噪聲信道,信噪比SNR取值在0dB到21dB之間,信噪比與誤比特率和數據傳輸速率仿真結果分如圖1、2所示。

從圖1可以看出,隨著SNR的值增大,誤比特變小,采用固定調制的階數越高,誤碼率越大。在信噪比的值為0dB到12dB之間時,固定64QAM、16QAM高階調制的誤碼率都較高,但是,在自適應調制和編碼方式下,誤碼率卻隨著信噪比變大很快變低,因為鏈路根據誤差信號功率情況自適應地選擇了恰當的調制方式和編碼率。從圖2可以看出,在其他參數不變的情況下,采用固定調制方式和編碼率時,數據的傳輸速率是一個定值,調制階數越高,數據傳輸速率越大。但在自適應調制和編碼方式下,鏈路根據信噪比情況,靈活改變了數據傳輸速率,信噪比的值越小,誤比特率就變高,此時數據傳輸速率減小,信噪比的值越高,誤比特率就變小,此時數據傳輸速率增大,在滿足信號質量要求的情況下達到了非常高的傳輸效率。

五、結論

論文對鏈路自適應調制與編碼技術下的預編碼算法進行了研究,在LTE系統中,預編碼技術被看作是解決空間各子信道相互干擾最有效的方法。論文采用基于信道矩陣奇異值分解的方法得到最優的預編碼矩陣,信號經過噪聲信道后,在接收端,采用基于最小誤碼率的MIMO接收機算法,減小發射信號和接收信號之間的誤差信號功率值,以此自適應選擇不同的調制方式和編碼,以便保證系統取得最大的傳輸容量。通過仿真驗證,在預編碼算法基礎上,采用自適應的調制和編碼方式能根據信噪比大小變化,靈活改變數據傳輸速率,在滿足信號質量要求的情況下達到了非常高的傳輸效率。

參 考 文 獻

[1] V Stankovic, M Haardt, Generalized Design of Multi-User MIMO Precoding Matrices [J].Wireless Communications, IEEE Transactions, 2008, 7(3):953-961.

篇5

以數字視頻的采集、壓縮、處理為核心的現代視頻監控技術,采用先進圖像處理芯片對視頻進行壓縮處理,把智能圖像處理技術用于圖像顯示、監控成為嵌入式視頻監控系統的重點研究方向[1]。無論是MPEG1、MPEG2或者是MPEG4、H.263都已經無法滿足運動圖像壓縮的要求,這時新一代的H.264標準便被制定,H.264作為新一代的編碼方式,有效提升了視頻壓縮率,僅需原先的一半帶寬即可播放相同質量的視頻,而且視頻編碼的碼率更加靈活,架構主要包括,幀內預測、幀間預測、轉換、量化、去區塊濾波器、熵編碼等模塊,下面將研究H.264視頻編碼的關鍵技術及其應用前景。[2]

1 H.264壓縮標準

H.264是兩個組織專家ITU-T和ISO為多媒體傳輸設計的數字視頻編碼標準[3],全稱是MPEG-4AVC,翻譯成中文意思是“活動圖像專家組-4的高等視頻編碼”,或稱為MPEG-4Part10。各種分辨率的視頻圖像格式都可以被H.264視頻編碼標準支持,包括sub-QCIF、QCIF、CIF、4CIF、16CIF等[4]。H.264是一種視頻壓縮標準,同時也是一種被廣泛使用的高精度視頻的錄制、壓縮和格式。H.264比其他編碼標準有著更高的視頻質量和更低的碼率,被廣泛用于網絡流媒體數據、各種高清晰度電視陸地廣播以及衛星電視廣播等領域。H.264的特點是能低碼率、高清晰持續提供較高的視頻質量,能大大加強圖像的編碼效率和改善圖像數據在網絡中的傳輸效率。[1],使網絡更加靈活、適應性更強,最大的好處就是節約了成本,彌補了技術差距,讓存儲與視頻管理變得更高效。

2 H.264編碼器的結構和特點

H.264只是規定了輸入碼流的格式及編碼之后輸出比特流的句法結構,其標準的編碼思路是混合編碼模式,以幀間和幀內預測來清除空間和時間的冗余分量,用變換和量化編碼來清除頻域冗余分量。H.264視頻編碼在一定情況下提高了視頻壓縮編碼性,其視頻解碼與編碼實現的過程相反,依據幀內編碼進行逆量化,反變換,重構幀,最后經塊濾波器平滑濾波后得到重建圖像,[1]H.264編碼器的功能組成框圖如1。

3 H.264編碼器關鍵環節分析

3.1 幀內預測 比起H.263,H.264提供了更多不同的工具來降低碼率,以編碼單位來說,h.264中每個宏塊(macroblock/mb)大小都是固定的16×16像素,能夠實現高分辨率視頻的壓縮,對于幀間編碼來說,它允許變換塊的大小根據運動補償塊的大小進行自適應的調整;對于幀內編碼來說,它允許變換塊的大小根據幀內預測殘差的特性進行自適應的調整。

3.2 幀間預測 H.264標準與早期標準不同之處在于,它所使用的是塊結構運動補償,運算精度精確到1/4像素點上。[8]不僅如此,H.264標準還使用了多幀預測的方法,能夠明顯改善預測增益。[5]

3.3 整數變換與量化 H.264中整型變換與之前的MPEG系列標準所采用的DCT變換都有區別:

①它是整形變換(所有的操作都為整數運算,不存在解碼精度損失)。②用整數算術變換可以確保編解碼之間實現零失配。③變換的核心運算部分只用到加法和移位運算,不需要乘除運算。④到量化器的縮放乘積因子為整數,減少了乘積因子的數據位數。[4]量化的目的是減小信號的值域,以更少的比特來表示信號,從而達到減少數據量的目的。H.264中量化的步長總共有52種,其按照12.5%遞增,并且變換系數的讀取有雙掃描和之字形兩種方式。

3.4 熵編碼 熵編碼是對數據的冗余信息進行壓縮的方法,變長編碼和Huffman編碼相結合進行,以較短的字長表示出現概率較大的數據,較長的字長表示出現概率較小的數據來達到降低數據量的目的。

CAVLC是一種變長編碼。先對變換系數進行zig-zag掃描。用行程碼(L,V)表示掃描以后的數據,V代表數值,L代表該數出現的次數。因為視頻塊在整形變換和量化后,大部分變換系數成為0,只有很少的數據在低頻部分,用行程數L代表連續出現的0的個數,V代表0串后挨著的非零值,接著對L和V分別采用Huffman編碼進一步壓縮,有不同的碼表可以查詢亮度塊和色度塊。行程編碼大大降低了編碼的碼字字長。CABAC是一種二進制算術編碼,其通過構建模型來預測當前的視頻信號。相對于CAVLC編碼,CABAC的編碼效率更高,更節省碼率。[4]

3.5 碼率控制 H.264視頻編碼標準雖然對于編碼器的結構實現模式沒有具體的規定,但編碼器實現的核心問題要解決編碼器的結構、相應的視頻編碼如何控制。H.264編碼器采用基于拉各朗日Lagrangian優化算法的率失真優化模型實現視頻編碼的控制,其實現方法簡單而且效率高。[5]

H.264編碼標準由于以上關鍵技術的支持,獲得了較高性能編碼,但編碼器復雜度增加,約為MPEG2的4倍,MPEG4的2倍。其高復雜度原因有兩個方面,一是編碼選項復雜,二是計算量高。具體內容有宏塊的劃分及搜索模式的組合的選取、高精度亞像素運動補償和多參考頓預測,H.264更細化,更精確的數據壓縮導致了計算量高。[6]

4 應用前景

H.264作為一種具有高效壓縮性能的視頻壓縮編碼技術,其在制定的過程中就充分參考和吸收了H系列和MPEG系列的優秀研究成果,修改或重新制定了其中不合理的部分,使其有很好的壓縮性能。H.264能夠比H.263和MPEG-4大約省去50%的碼率。[7]H.264的高效的視頻壓縮能力和優異的網絡適應性,為視頻數據傳輸的可靠性提供了保障,其可廣泛應用于數字攝像、英特網、數字視頻錄像、DVD及電視廣播等領域的圖像壓縮。

5 結束語

網絡視頻監控系統要達到良好的監控效果,僅提高攝像頭的分辨率是不行的,只有通過改善數字視頻的壓縮技術,降低視頻傳輸的誤碼率,提高視頻的質量,才能推動網絡視頻走向智能化。[1]H.264標準的推出是視頻編碼標準的一次重要的進步,盡管其算法復雜,但是能夠大幅度提高編碼效率,使得應用范圍更加的廣泛。

參考文獻:

[1]李紅京.基于H.264視頻壓縮技術的網絡視頻傳輸系統設計[J].河北工業科技,2011,28(4):236-239.

[2]齊淋淋,向健勇,唐巍.H.264視頻壓縮關鍵技術及其應用前景[J].電子科技,2005(10)13-16.

[3]黨曉軍,尹俊文.基于H264的嵌入式視頻監控系統研究[J].計算機技術與應用進展,2008:407-412.

[4]劉繼紅,孫海龍,屈鵬.TD-MBMS中H.264視頻壓縮的實現過程[J].信息通信,2008,4:14-16.

[5]牛建民.H.264視頻壓縮算法應用研究[M].同濟大學工程碩士學位論文,2007,5.

篇6

WAVELET源起於JosephFourier的熱力學公式。傅利葉方程式在十九世紀初期由JosephFourier(1768-1830)所提出,為現代信號分析奠定了基礎。在十九到二十世紀的基礎數學研究領域也占了極重要的地位。Fourier提出了任一方程式,甚至是畫出不連續圖形的方程式,都可以有一單純的分析式來表示。小波分析是近幾年來才發展出來的數學理論為傅利葉方程式的延伸。

小波分析方法的提出可追溯到1910年Haar提出的小波規范正交基。其後1984年,法國地球物理學J.Morlet在分析地震波的局部性質時,發現傳統的傅利葉轉換,難以達到其要求,因此引進小波概念於信號分析中,對信號進行分解。隨後理論物理學家A.Grossman對Morlet的這種信號根據一個確定函數的伸縮,平移系{a-1/2Ψ[(x-b)/a];a,b?R,a≠0}展開的可行性進行了研究,為小波分析的形成開了先河。

1986年,Y.Meyer建構出具有一定衰減性的光滑函數Ψj,k(x),其二進制伸縮與平移系{Ψj,k(x)=√2jΨ(2jx-k);j,k?Z}構成L2(R)的規范正交基。1987年,Mallat巧妙的將多分辨分析的思想引入到小波分析中,建構了小波函數的構造及信號按小波轉換的分解及重構。1988年Daubechies建構了具有正交性(Orthonormal)及緊支集(CompactlySupported);及只有在一有限區域中是非零的小波,如此,小波分析的系統理論得到了初步建立。

三、WAVELET影像壓縮簡介及基礎理論介紹

一、WAVELET的壓縮概念

WAVELET架在三個主要的基礎理論之上,分別是階層式邊碼(pyramidcoding)、濾波器組理論(filterbanktheory)、以及次旁帶編碼(subbandcoding),可以說wavelettransform統合了此三項技術。小波轉換能將各種交織在一起的不同頻率組成的信號,分解成不相同頻率的信號,因此能有效的應用於編碼、解碼、檢測邊緣、壓縮數據,及將非線性問題線性化。良好的分析局部的時間區域與頻率區域的信號,彌補傅利葉轉換中的缺失,也因此小波轉換被譽為數學顯微鏡WAVELET并不會保留所有的原始資料,而是選擇性的保留了必要的部份,以便經由數學公式推算出其原始資料,可能不是非常完整,但是可以非常接近原始資料。至於影像中什度要保留,什麼要舍棄,端看能量的大小儲存(跟波長與頻率有關)。以較少的資料代替原來的資料,達到壓縮資料的目的,這種經由取舍資料而達到壓縮目地的作法,是近代數位影像編碼技術的一項突破。即是WAVELET的概念引入編碼技術中。

WAVELET轉換在數位影像轉換技術上算是新秀,然而在太空科技早已行之有年,像探測衛星和哈柏望遠鏡傳輸影像回地球,和醫學上的光纖影像,早就開始用WAVELET的原理壓縮/還原影像資料,而且有壓縮率極佳與原影重現的效果。

以往lossless的編碼法只著重壓縮演算法的表現,將數位化的影像資料一絲不漏的送去壓縮,所以還原回來的資料和原始資料分毫無差,但是此種壓縮法的壓縮率不佳。將數位化的影像資料轉換成利於編碼的資料型態,控制解碼後影像的品質,選擇適當的編碼法,而且還在擷取圖形資料時,先幫資料「減肥。如此才是WAVELET編碼法主要的觀念。

二、影像壓縮過程

原始圖形資料色彩模式轉換DCT轉換量化器編碼器編碼結束

三、編碼的基本要素有三點

(一)一種壓縮/還原的轉換可表現在影像上的。

(二)其轉換的系數是可以量化的。

(三)其量化的系數是可以用函數編碼的。

四、現有WAVELET影像壓縮工具主要的部份

(一)WaveletTransform(WAVELET轉換):將圖形均衡的分割成任何大小,最少壓縮二分之一。

(二)Filters(濾鏡):這部份包含WaveletTransform,和一些著名的壓縮方法。

(三)Quantizers(量化器):包含兩種格式的量化,一種是平均量化,一種是內插量化,對編碼的架構有一定的影響。

(四)EntropyCoding(熵編碼器):有兩種格式,一種是使其減少,一種本論文由整理提供

為內插。

(五)ArithmeticCoder(數學公式):這是建立在AlistairMoffatslineartimecodinghistogram的基礎上。

(六)BitAllocation(資料分布):這個過程是用整除法有效率的分配任何一種量化。

肆、WAVELET影像壓縮未來的發展趨勢

一、在其結構上加強完備性。

二、修改程式,使其可以處理不同模式比率的影像。

三、支援更多的色彩??梢蕴幚鞷GB的色彩,像是YIQ、HUV的色彩定義都可以分別的處理。

四、加強運算的能力,使其可支援更多的影像格式。

五、使用WAVELET轉換藉由消除高頻率資料增加速率。

六、增加多種的WAVELET。如:離散、零元樹等。

七、修改其數學編碼器,使資料能在數學公式和電腦的位元之間轉換。

八、增加8X8格的DCT模式,使其能做JPEG的壓縮。

九、增加8X8格的DCT模式,使其能重疊。

十、增加trelliscoding。

十一、增加零元樹。

現今已有由中研院委托國內學術單位研究,也有不少的研究所的碩士。國外更是如火如荼的展開研究。相信實際應用於實務上的日子指日可待。

伍、影像壓縮研究的方向

1.輸入裝置如何捕捉真實的影像而將其數位化。

2.如何將數位化的影像資料轉換成利於編碼的資料型態。

3.如何控制解碼影像的品質。

4.如何選擇適當的編碼法。

5.人的視覺系統對影像的反應機制。

小波分析,無論是作為數學理論的連續小波變換,還是作為分析工具和方法的離散小波變換,仍有許多可被研究的地方,它是近幾年來在工具及方法上的重大突破。小波分析是傅利葉(Fourier)分析的重要發展,他保留了傅氏理論的優點,又能克服其不足之處。

陸、在印刷輸出的應用

WAVELET影像壓縮格式尚未成熟的情況下,作為印刷輸出還嫌太早。但是後續發展潛力無窮,尤其在網路出版方面,其利用價值更高,WAVELET的出現就猶如當時的JPEG出現,在影像的領域中掀起一股旋風,但是WAVELET卻有JPEG沒有的優點,JPEG乃是失真壓縮,且解碼後復原程度有限,能在網路應用,乃是由於電腦的解析度并不需要太高,就可辨識其圖形。而印刷所需的解析度卻需一定的程度。WAVELET雖然也是失真壓縮,但是解碼後卻可以還原資料到幾乎完整還原,如此的壓縮才有存在的價值。

有一點必須要提出的就是,并不是只要資料還原就可以用在印刷上,還需要有解讀其檔案的RIP,才能用於數位印刷上。等到WAVELET的應用成熟,再發展其適用的RIP,又是一段時間以後的事了。

在網路出版上已經有瀏覽器可以外掛讀取WAVELET檔案的軟體了,不過還是測試版,可是以後會在網路上大量使用,應該是未來的趨勢。對於網路出版應該是一陣不小的沖擊。圖像壓縮的好處是在於資料傳輸快速,減少網路的使用費用,增加企業的利潤,由於傳版的時間減少,也使印刷品在當地印刷的可能性增高,減少運費,減少開支,提高時效性,創造新的商機。

柒、結論

WAVELET的理論并不是相當完備,但是據現有的研究報告顯現,到普及應用的階段,還有一段距離。但小波分析在信號處理、影像處理、量子物理及非線性科學領域上,均有其應用價值。國內已有正式論文研究此一壓縮模式。但有許多名詞尚未有正式的翻譯,各自有各自的翻譯,故研究起來倍感辛苦。但相信不久即會有正式的定名出現。這也顯示國內的研究速度,遠落在外國的後面,國外已成立不少相關的網站,國內僅有少數的相關論文。如此一來國內要使這種壓縮模式普及還有的等。正式使用於印刷業更是要相當時間。不過對於網路出版仍是有相當大的契機,國內仍是可以朝這一方面發展的。站在一個使用其成果的角度,印刷業界也許并不需要去了解其高深的數理理論。但是在運用上,為了要使用方便,和預估其發展趨勢,影像壓縮的基本概念卻不能沒有。本篇文章單純的介紹其中的一種影像壓縮模式,目的在為了使後進者有一參考的依據,也許在不久的將來此一模式會成為主流,到時才不會手足無措。

參考文獻:

1.GeoffDavis,1997,WaveletImageCompressionConstructionKit,。

2.張維谷.小宇宙工作室,初版1994,影像檔寶典.WINDOWS實作(上),峰資訊股份有限公司。

3.張維谷.小宇宙工作室,初版1994,影像檔寶典.WINDOWS實作(下),峰資訊股份有限公司。

4.施威銘研究室,1994,PC影像處理技術(二)圖檔壓縮續篇,旗標出版有限公司。

5.盧永成,民八十七年,使用小波轉換及其在影像與視訊編碼之應用,私立中原大學電機工程學系碩士學位論文。

6.江俊明,民八十六年,小波分析簡介,私立淡江大學物理學系碩士論文。

7.曾泓瑜、陳曜州,民八十三年,最新數位訊號處理技術(語音、影像處理實務),全欣資訊圖書。

附錄:

嵌入式零元樹小波轉換、階層式嵌入式零元樹小波轉換、階層式影像傳送及漸進式影像傳送

目前網路最常用的靜態影像壓縮模式為JPEG格式或是GIF格式等。但是利用這些格式編碼完成的影像,其資料量是不變的,其接受端必須完整地接受所有的資料量後才可以顯示出編碼端所傳送的完整影像。這個現象最常發生在利用網路連結WWW網站時,我們常常都是先接收到文字後,其網頁上的圖形才,慢慢的一小部份一小部份顯示出來,有時網路嚴重塞車,圖形只顯示一點點後就要再等非常久的時間才再有一點點顯示出來,甚至可能斷線了,使得使用者完全不知道在接收什麼圖案的圖形,無形中造成網路資源的浪費。此缺點之改善,可以使用嵌入式零元樹小波轉換(EZW)來完成。

階層式影像傳送系統的主要功能為允許不同規格之顯示裝置或解碼器可以從同一編碼器中獲得符合其要求之訊號,如此不需要對於不同的解碼器設計不同的編碼器配合利用之,進而增加了其應用的范圍,及減低了所架設系統的復雜度,也可以節省更多的設備費用。利用Shapiro所提出的嵌入式零元樹小波轉換(EZW)技術來設計階層式影像傳送系統時,其編碼的效果不是很好。主要的原因是,利用(EZW)技術所設計的編碼器是根據影像的全解析度來加以編碼的,這使得擁有不同解析度與碼率要求的解碼器,無法同時分享由編碼器所送出來的位元流。雖然可以利用同時播放(Simulcast)技術來加以克服之,但是該技術對於同一影像以不同解析度獨立編碼時,將使得共同的低通次頻帶(LowpassSubband)被重復的編碼與傳送,而產生了相當高的累贅(Redundancy)。

基於上述情況,有人將嵌入式零元樹小波轉換(EZW)技術加以修改之,完成了一個新式的階層式影像傳送系統。該技術為階層式嵌入的零元樹小波轉換(LayeredEmbeddedZerotreeWavelet,簡稱LEZW技術。這個技術本論文由整理提供

使我們所設計出來的階層式影像傳送系統,可以在編碼傳送前預先指定圖層數目、每層影像的解析度與碼率。

LEZW技術是將EZW技術中的連續近似量化(SAQ)加以延伸應用之,而EZW傳統的做法是將SAQ應用於全部的小波轉換系數上。然而在LEZW技術中,從基層(BaseLayer)開始SAQ一次僅用於一個圖層(Layer)的編碼,直到最高階析度的圖層為止。當編碼的那一圖層碼率利用完時,即表示該圖層編碼完畢可以再往下一圖層編碼之。為了改善LEZW的效率,在較低圖層的SAQ結果應用於較高圖層的SAQ過程中,基於這種編碼的程序,LEZW演算法則可以在每一圖層平均碼率的限制下,重建出不同解析度的影像。因此,LEZW非常適合用於設計階層式影像傳送系統。

LEZW技術也可以應用於漸進式傳送,對於一個漸進式影像傳送系統而言,控制其解析度將可以改善重建影像的視覺品質。而常用的漸進式傳送方法有使用向量量化器或零元樹資料結構編碼演算法則。但是向量量化器需要較大的記憶體及對與傳送中的錯誤敏威,而利用EZW技術所設計的漸進式影像傳送系統,可以改善這些缺點,所以享有較好的效能。但是它也有缺點就是,應用於漸進式傳送時是根據全解析度來做編碼及傳送,因此在低碼率的限制之下時,若用全解析度來顯示影像將使得影像模糊不清。所以在低碼率傳送時的影像以較低的解析度來顯示時,則可以使影像的清晰度有所改善。

所以將LEZW技術延伸至漸進式傳送,在編碼之前可以先設定每一級(Stage)的解析度與傳送每一級所累加的碼率(AccumulatedRate),然後再編碼與傳送之。該系統在低碼率時用低解析度來顯示影像,在較高碼率時則以高解析度來顯示影像,將改善漸進式傳送的視覺品質。此系統在編碼傳送的過程中,允許傳送的位元流在任一點位置被中斷停止,而接收端可以由所接收到的資料,將影像重建在資料中斷時的解析度下。

篇7

專論、綜述、研究論文、研究簡報、前言動態、信息交流。

 

投稿須知

1.文稿要求。來稿要求內容充實、立意創新。寫作上要重點突出,條理分明,論據充分,數據可靠,文字簡練。書寫要工整,用字要規范,標點要正確,計量單位和符號要符合國家標準。外文字母、數學符號、拉丁學名要分清大、小寫,正、斜體;上、下角的字母、數碼和符號,其位置也應標示清楚。為便于快速處理稿件,來稿須一式兩份(一份可以是復印件),以便同時送審,稿件請用5號宋體1.5倍行距打印在A4紙上,寫明排版軟件,并附相應磁盤。推薦使用電子郵件或網站稿件遠程處理系統投稿。

2.文稿內容。來稿須包括:中文題目,作者姓名,單位、地址、郵政編碼,摘要、關鍵詞;英文題目,作者英文姓名,單位、地址、郵政編碼,英文摘要Abstract、關鍵詞Keywords;正文部分;致謝;參考文獻。正文部分區分綜述專論、研究論文和簡報,對內容和格式要求有所差別。綜述專論須包括:引言、展開論述部分、結論及展望。研究論文和簡報須包括:引言、材料與方法、結果與分析、討論四部分。文章篇幅,綜述專論和研究論文通常不超過5個頁碼,約8000字;研究簡報不超過3個頁碼,約5000字。

2.1標題。文章標題務求簡明扼要,以反映論文主題,一般不超過20字,避免使用副標題,避免在標題中出現縮略語、字符、代號和公式等。英文標題與中文相吻合,除連詞、介詞及冠詞外,詞的首字母大寫。正文中各級標題應精煉明確,以不超過15字為宜。用阿拉伯數字連續編號,可用至3級標題,不同級別的數字之間用實心圓點“.”相隔,最末數字不加標點,如:“2”“2.1”“2.1.1”,以此類推,一律左頂格,后空一字距寫標題。正文引言部分不立標題,不加編號。

2.2作者與單位。文章作者的署名人數及順序由作者自定,但要求文稿無知識產權爭議問題,所有署名作者對文稿署名認可。多位作者的署名之間用逗號隔開,并分別注明所有作者的單位、城市和郵政編碼。

2.3摘要與關鍵詞。正文前須有200~300字摘要,包括目的、方法、結果和結論,能夠簡明確切地反映論文的主要信息,并重點提示出論文的創新之處。英文摘要應與中文摘要一致。在中、英文摘要下方分別列出中、英文一致的關鍵詞3~8個。

2.4腳注。來稿首頁注腳處注明論文資助的基金項目和作者簡介(第一作者或/和通訊作者)?;痦椖堪ㄕn題來源、名稱及基金代號;作者簡介包括姓名、出生年份、性別、籍貫、民族(漢族可略)、職稱、學位、所從事專業方向及聯系方式(包括電話、E-mail)。

2.5圖與表。文中圖與表一般不超過3~5個,且精煉、完整;圖表的題、項、注等要求英漢雙解;表格一律采用三線表。在文字中概括歸納圖表內容時,避免逐項重述數據及圖表的重復使用。圖表的標題、內容及注解一律用中英文對照標示。請作者同時提供圖片的原始文件,以保證圖片的清晰。

2.6參考文獻。參考文獻只列入近期的、主要的、已公開出版的引用文獻;按在論文中出現的順序掛角于文末;內容、書寫順序應規范;一般不超過30個。參考文獻的著作者少于3人時全部列出,超過3人時,只列前3人,后加“等”字(英文為“etal.”)。主要文獻的書寫格式如下:

書:[序號]著者.書名.版次(第1版不標注),出版地:出版者,出版年.起-止頁碼

期刊:[序號]著者.文章名.期刊名(英文刊名可縮略),出版年,卷(期):起-止頁碼

會議錄、論文集等:[序號]著者.文章名.見(In):編者名.文集名.會議名,會址,開會年,出版地:出版者,出版年.起-止頁碼

專利:[序號]專利持有者.專利名稱.專利國別,專利號

篇8

1、引言

H.264是一種高性能的視頻編解碼技術, 它是ITU-T的VCEG(視頻編碼專家組)和ISO/IEC的MPEG(活動圖像編碼專家組)的聯合視頻組(JVT:joint video team)開發的一個新的數字視頻編碼標準,它既是ITU-T的H.264,又是ISO/IEC的MPEG-4的第10 部分。論文寫作,整像素預測。

作為新一代的視頻編碼標準,它具有很高的數據壓縮比率和優異的性能,廣泛應用于視頻會議、視頻點播、高清視頻、移動播放器等多個領域。

H.264最大的優勢是具有很高的數據壓縮比率,在同等圖像質量的條件下,H.264的壓縮比是MPEG-2的2倍以上,是MPEG-4的1.5~2倍。論文寫作,整像素預測。和MPEG-2和MPEG-4ASP等壓縮技術相比,H.264壓縮技術將大大節省用戶的下載時間和數據流量收費。論文寫作,整像素預測。尤其值得一提的是,H.264在具有高壓縮比的同時還擁有高質量流暢的圖像。

在H.264的編碼芯片結構中,相比幀內,幀間(Inter Prediction)編碼的效率高,但是運算復雜度也比較高。幀間編碼的核心運算部分是“ME”(motion estimation)即運動估計,占用最多的邏輯與時鐘資源。幀間預測的運動估計過程分為整像素運動估計(IME)和分像素運動估計(FME),首先找到整像素的最佳MV,然后再進行分像素的搜索。除了巨大的計算復雜度,編碼過程也很長,包括預測,重構和熵編碼。

2、運動估計運算

H.264幀間預測是利用已編碼視頻幀/場和基于塊的運動補償的預測模式。由于引入了1/4像素精度、多種分割預測等先進技術,在獲得更高壓縮率的同時,其算法復雜度也大大提高,使得幀間預測編碼耗時占到整個編碼計算時間的50%以上,若采用全軟件實現高清圖像的實時編解碼,明顯力不從心,這就要求使用高性能的硬件編解碼器來完成高清實時編解碼任務,這也是本人研究的主要內容。

編碼宏塊(16x16象素)可以分割成不同大小的塊像數據,例如16x16、16x8、8x16、8x8、8x4、4x8、4x4等七種模式。而“ME”的再對各種宏塊分割方式下的每個塊象素進行預測運算,然后由后續模塊統計和比較出最優的分割方式。

運動估計包括整像素預測(IME)和分像素預測(IME)兩部分,這兩部分是串行的。每一個宏塊,只有在IME 做完之后,找到最佳整像素MV,再進行FME。

在進行IME計算時,首先要計算MVP,對于一個塊象素,預測運算就是在參考幀中搜索出最佳匹配(即兩者差異最小)的同尺寸塊象素作為當前塊的參考區域。如果在整個參考幀的范圍下進行全面的搜索,固然可以得到最為匹配的區域,但是復雜度太大。事實上,相鄰塊在參考幀中的匹配區域一般位置比較接近。綜合考慮算法復雜度,編碼效果,資源使用等方面,幀間預測做了如下處理:首先根據周邊塊的Mv值預測出當前塊的Mv值,即Mvp,然后在Mvp所指參考幀中象素點周邊搜索最佳塊象素。

MVP的搜索過程如圖2所示,假定E為當前的宏塊、宏塊分割或者亞宏塊分割,除了16x8和8x16,MVP為A、B、C的MV的中值;對于16x8分割,上面部分MVP由A預測,下面部分MVP由B預測;對于8x16分割,左面部分MVP由B預測,右面部分MVP由C預測。論文寫作,整像素預測。以MVP作為搜索的起點。

圖2 MVP 計算

IME在進行當前宏塊MB(x)的MVP計算的時候,前面的宏塊MB(x-1)包含分像素的MV還未得到,這個時候我們無法得到準確的A,所以我們此時以MB(x-1)的16x16分割搜索時所得到的整像素MV來代替A,并把據此計算得到的MVP作為搜索的起點。

3、IME模塊及功能

IME模塊的架構如下圖所示

圖3 IME模塊架構圖

IME的主要功能是:

(1)數據:把原始和參考YUV從inter_config模塊中取出,為PS和FME模塊準備預測所需數據;

(2)控制:控制幀間預測的過程

IME的模塊劃分及各自功能:

Pipe_ctrl:不同分割間的搜索和選擇 將不同分割方式的順序搜索改為并行,用兩條水線來實現加速 Pipe0:進行P16x16,P8x16,P4x8 ;Pipe1:進行P8x8,P16x8,P8x4,4x4由兩條共同完成(為了減少pipe0的等待時間,把pipe1的部分工作放到pipe0中)

MVp_ctrl:每種分割的具體搜索過程

(1)計算MVp值

(2)控制reg_ctrl模塊的數據存取

Reg_ctrl:為相連模塊準備數據

(1)為整像素準備數據,傳輸給PS模塊;

(2)為分像素搜索準備數據,傳輸給FME模塊;

(3)為重構準備數據,傳輸給FME模塊

4、與IME模塊相關的主要功能模塊

圖3中與IME工作相關的有兩個主要的部分,一個是Inter_config 模塊,還有一個是PS模塊,它們在系統中起著重要的作用。論文寫作,整像素預測。

1. Inter_config模塊及功能描述

Inter_config模塊,即幀間數據調度模塊,其數據傳送如圖4所示,Inter_config模塊有兩部分功能:一是為IME服務,把IME所需的數據從DDR取到Sram;二是為Loop Filter服務,把LoopFilter模塊的deblock運算所需要的一部分數據從DDR取到Sram以及將deblock運算后的宏塊數據存入DDR。

圖4 Inter_config模塊數據傳送

Inter_config模塊與IME有關的工作包括:

1)取原始YUV數據,Luma部分直接拉給IME_Reg_o,Chroma部分存入Sram0。

2)為IME準備計算所需的9個宏塊的Luma數據,并存入Sram0和Sram1。

3)將這9個宏塊的Chroma數據準備到Sram1中,用于Chroma資料拼接之用。

4)接收到IME_ChromaStart_i信號有效后,開始FME運算所需Chroma數據的相關準備工作。包括:①從Sram0中取Chroma的原始YUV送給IME;②從Sram0中取Chroma3x3Mb數據并進行拼接(將每個block對應的2x2像素,向右向下擴展,變成3x3像素)后送給IME。論文寫作,整像素預測。

5)把最后一行的5個mv(當前Mb最后一行的block的4個mv及右側相鄰的1個mv)存入Sram0,作為下一宏塊行進行Mvp預測所需數據。

2. PS模塊功能描述

PS模塊,即預測選擇模塊,本模塊主要用于選擇當前編碼宏塊的最佳預測方式,幀內預測還是幀間預測;若是幀間預測還需給出宏塊的最佳分割以及分割的最佳MV,除此之外,還需求殘差值,用于后面的重建。其主要功能如下:

1)接收IME模塊的整像素亮度值,以進行整像素搜索,找出最佳的整像素MV;

2)將兩套流水線所得出的cost進行比較,選出最佳partition;

3)接收inter_ctrl模塊中IME模塊的亞像素亮度值,以進行亞像素搜索,找出最佳的亞像素MV以及cost,并與最佳的整像素MV的cost相比較,選擇最佳的MV;

4)將選出的最佳的cost與intra_ctrl中的最佳的cost,比較得出最佳的預測方式,幀間還是幀內;

5)若選出的是幀內,則結束當前宏塊的幀間操作,準備下一個宏塊的幀間操作;若選出的是幀間,則接收IME或FME的亮度和色度值,進行求殘差操作,送給DCT以備后面重建。

5、總結及展望

本文對幀間編碼中IME運算所需數據進行探討和分析,并提出一套架構設計方案,時序和資源使用都比較優化。設計方案在空間上具有較高的并行度,處理能力高,非常適合實現高清視頻編碼。目前市場上對于H.264的研究開發一般都是基于PC或者DSP解決,很少有基于硬件實現的開發,功能上還不足以實現高清實時信號的編碼和解碼。本設計能夠實現幀間預測的關鍵部分,在后續的研究中如果能使用H.264標準在幀間預測所帶來的高壓縮率,如果能將其帶來的復雜度的增加限制在可容忍的范圍內,支持幀間預測的高清實時視頻編解碼的芯片實現是非常有意義的,應用前景很廣闊。

參考文獻

[1]新一代視頻壓縮編碼標準——H.264/AVC 畢厚杰 人民郵電出版社

[2]Iain E.G.Richardson.H.264 and MPEG-4 Video Compression: VideoCoding for Next Generation Multimedia. U.S: Wiley Press, 2003.

[3]Tung-Chien Chen, Chung-JrLian, and Liang-Gee Chen. Hardware Architecture Design of an H.264/AVC VideoCodec. Asia and South Pacific Conference on. Design Automation, 2006.

篇9

(二)關鍵詞:是反映文章最主要內容的術語詞,每篇文章選3-8組為宜。

(三)作者簡介:包括姓名(出生年)、性別、民族、籍貫、職稱、研究方向、工作單位、地址、郵編、電話及電子信箱。

(四)文章題目、作者單位、摘要及關鍵詞均應譯出英文,著者姓名標出漢語拼音。

(五)參考文獻:指著者引文(正式出版物)所注的出處,文中用方括號按先后順序標出,且置于行文的右上角,文獻說明一律放在文末,即采用順序編碼制。外文參考文獻按照國際通行的著錄格式標注。 其格式如下:

1.著作:[序號] 主要責任者. 文獻題名 [M]. 出版地:出版社, 出版年. 起止頁碼(任選).

[1]孫漢超.體育管理學教程[M]. 北京:人民體育出版社,1996. 178-180.

2.譯著:[序號]國名或地區(用圓括號)主要責任者.文獻題名[M].譯者. 出版地: 出版社,出版年. 起止頁碼(任選).

[1]喬治·迪特曼.提高速度的秘訣[M].段金譯.長沙:湖南文藝出版社,2002.151.

3.論文集:[序號] 主要責任者. 文獻題名 [C]. 出版地:出版社, 出版年. 起止頁碼(任選).

[1]辛希孟. 信息技術與信息服務國際研討會論文集:A集[C]. 北京: 中國社會科學出版社, 1994.

4.論文集中的析出文獻:[序號]析出文獻主要責任者. 析出文獻題名 [A]. 原文獻主要責任者(任選).原文獻題名[C].出版地: 出版社, 出版年. 析出文獻起止頁碼.

[1]鐘文發. 非線性規劃在可燃毒物配置中的應用[A]. 趙瑋. 運籌學的理論與應用——中國運籌學會第五屆大會論文集[C]. 西安:西安電子科技大學出版社,1996. 468-471.

5.期刊文章:[序號] 主要責任者. 文獻題名 [J]. 刊名,年,卷(期): 起止頁碼(任選).

[1]萬曉紅,歐陽柳青,楊梅,等. 試論奧林匹克運動會的社會功能及人文價值[J]. 武漢體育學院學報, 2003, 37(3): 4-6.

6.報紙文章:[序號] 主要責任者. 文獻題名 [N].報紙名,出版日期(版次).

[1] 孫浩. 肥胖已成全球問題[N]. 健康報,2004-05-18(5).

7.電子文獻:[序號] 主要責任者. 電子文獻題名 [EB/OL].文獻出處或可獲得地址,發表或更新日期/引用日期(任選).

[1]華欄,包建. 心理養生——21世紀健康主題 [EB/OL]. dzjk.com. 2004-03-20.

參考文獻類型標識 參考文獻類型 專著 論文集 報紙文章 期刊文章 學位論

文 報告 標準 專利

文獻類型標

識 M C N J D R S P

二、省(部)級以上立項的課題(項目),請注明項目名稱與編號,并附上復印件。

三、本刊實行匿名審稿制度,凡“作者簡介”信息一律另頁列出。

四、本刊對決定采用的文稿,會通知作者再給本刊寄發電子版。敬請合作,謹表謝意。

中文版論文格式:

標題(居中,小二黑體)

作者姓名1,作者姓名2,作者姓名3(小四號宋)

作者單位, (郵政編碼)(五號仿宋)

作者單位, (郵政編碼)(五號仿宋)

作者單位, (郵政編碼)(五號仿宋)

E-mail(小五,Times New Roman)

摘 要:本文給出了一種?(五號,楷體)頁邊距: 左右各:3.17cm, 上下各:3.5cm;頁眉:2.8cm, 頁腳3.0cm。 關鍵詞:(3-5個)

1. 引 言(四號,宋體,加粗)

近年來。。。(正文五號宋體,段首空兩漢字字符,1.25倍行距)頁邊距: 左右各:3.17cm, 上下各:3.5cm;頁眉:2.8cm, 頁腳:3.0cm。

2. 系統介紹(同上)

2.1 一級子標題(小四號,宋體,加粗) 2.1.1 二級子標題(五號,宋體,加粗) 3. 。。。。。。 4. 。。。。。。 5. 結論(同上)

本文給出了。。。

篇10

投稿要求:

1.本刊實行無紙化辦公,不接收打印稿,投稿請通過電子郵件發送。

2.文稿應具科學性、邏輯性,并有理論和實踐意義。來稿文字務求準確、精練、通順、重點突出;公式或代號要分清上、下

角標,計量單位采用國際計量標準。表格、圖形清晰明了。

3.來稿請寫清標題、作者姓名、作者單位(全稱)、作者簡介、聯系方式(含電話、電子郵箱、通信地址與郵政編碼),第一

作者身份證號碼(發放稿費需要)。

4. 稿件寫作要求如下:

文章題目一般不超過20字。署名作者應為對論文主題研究及撰寫做出主要貢獻,能夠負責答辯的人員。作者單位應標注支持完成研究工作并對研究內容承擔責任的單位,同時寫明其所在省市(縣)名稱和郵政編碼;作者姓名右上角和單位名稱前應用數字角碼標明相互對應關系。

“摘要”應概述研究的目的、材料、方法、結果和主要結論?!瓣P鍵詞”應選用能反映文章特征內容,較為通用的規范性詞匯。

內文的格式,請參照本刊近期發表的文章。前言應概述研究背景和本研究的目的?!安牧吓c方法”應寫明試驗材料、時間、地點、重復次數、取樣數量、方法?!敖Y果與分析”應簡明扼要,層次分明,試驗數據須進行必要的統計分析。“討論”應結合前人的工作著重論述本文的創新點,避免太遠的推論。

文中一級標題序號用1,二級用1.1,三級用1.1.1,均靠左側頂格書寫。拉丁文生物學名的屬、種名為斜體,定名人為正體,屬名在文中首次出現時不縮寫。數字一般用阿拉伯數字。

表格采用三線表形式。線條圖須用計算機作圖,且該圖形文件可在Word文件中打開并可編輯,若Excel作圖須帶數據源。照片插圖需插入文稿中相應位置(復印件即可),并單獨提供圖片電子文件或原版照片。表題、表頭、欄目、表注、橫縱坐標說明、圖例、圖版說明等要齊全。

參考文獻的著錄格式,采用順序編碼制,即應按文中引用的先后順序編號,并在文后按同一順序依次列出。常用參考文獻格式如下:

期刊:[序號]作者. 篇名[J]. 期刊名,年份,卷(期):起止頁.

專著:[序號]作者. 書名[M]. 版次(1版不寫). 出版地:出版者,出版年:起止頁.

論文集:[序號]作者. 篇名[C]. // 主編. 論文集名. 出版地:出版者,出版年:起止頁.

學位論文:[序號]作者. 篇名[D]. 保存地點:保存單位,年份.

參考文獻作者不超過3人的全部寫出,超過3人的只寫前3名,后加“,等”或“,et al”;英美德俄等國人名書寫時,應姓前名后,名用縮寫。

5.來稿文責自負。本刊可對來稿做文字修改、刪節,凡不愿修改的,請投稿時作特別說明。

篇11

1.來稿要求論點明確、數據可靠、邏輯嚴密、文字精煉,每篇論文必須包括題目、作者姓名、作者單位、單位所在地及郵政編碼、摘要和關鍵詞、正文、參考文獻和第一作者及通訊作者簡介(包括姓名、性別、職稱、出生年月、所獲學位、目前主要從事的工作和研究方向),并請在文稿的首頁地腳處注明論文屬何項目、何基金(編號)資助,沒有的不注明。

2.論文摘要盡量寫成報道性文摘,包括目的、方法、結果、結論4方面內容(100字左右),應具有獨立性與自含性,關鍵詞選擇貼近文義的規范性單詞或組合詞(3~5個)。

3.文稿篇幅(含圖表)一般不超過4000字,一個版面2400字內。文中量和單位的使用請參照中華人民共和國法定計量單位最新標準。外文字符必須分清大、小寫,正、斜體,黑、白體,上下角標應區別明顯.

4.文中的圖、表應有自明性。圖片不超過2幅,圖像要清晰,層次要分明。

5.參考文獻的著錄格式采用順序編碼制,請按文中出現的先后順序編號。所引文獻必須是作者直接閱讀參考過的、最主要的、公開出版的文獻。未公開發表的、且很有必要引用的,請采用腳注方式標明,參考文獻不少于3條。

來稿特別約定

1來稿勿一稿多投,收到稿件之后,7個工作日內共同審稿,電子郵件回復作者。重點稿件將送同行專家審閱。如果10日內沒有收到擬用稿通知(特別需要者可寄送紙質錄用通知),則請與我們聯系確認。

2.來稿文責自負。所有作者應對稿件內容和署名無異議,稿件內容不得抄襲或重復發表。對來稿有權作技術性和文字性修改,作者需要安排版面數,出刊日期,是否加急等情況,請在郵件投稿時作特別說明

3.請作者自留備份稿,不退稿。

篇12

0、引言

H.264/AVC是由聯合視頻專家組JVT(Joint Video Team)于2003年5月正式批準的新一代視頻編碼標準[1、2]。論文指南。與以往的標準相比較,H.264具有壓縮效率高、網絡適應性好和適用于交互和非交互的應用環境的顯著特點,現在得到了廣泛應用,并處于不斷的改進中。

H.264/AVC采用一項重要新技術:基于空間域的幀內預測,它充分利用了圖像的空間相關性,根據已解碼的相鄰塊的信息來預測當前塊的信息,來提高編碼性能。H.264/AVC在RDO(RateDistortion Optimization)模式下進行幀內預測模式選擇,用最少的比特率獲得了最好的編碼效果,但由于H.264/AVC支持的幀內預測模式很多,為了確定一個宏塊(Macroblock,MB)的幀內預測模式,需要計算592種組合模式的率失真代價(RD_Cost),其運算量占整個模式選擇的60%左右,從而使編碼器的復雜度很高。在實際編碼結果中Intra_4×4模式會占據編碼模式中的大部分,因此對RDO模式下4×4子塊的研究非常有必要,對研究快速幀內預測算法具有重要的應用價值。

1、H.264/AVC幀內預測模式

H.264/AVC支持三類幀內預測:一、Intra_4×4是針對4×4亮度塊的預測,有9種預測模式,其中包括DC預測模式(即均值預測模式)和8種具有一定方向性的預測模式;二、Intra_16×16是針對16×16亮度塊的預測,有4種預測模式;三、Intra_8×8是針對8×8色度塊的預測,有4種預測模式,預測模式和Intra_16×16一樣,只是模式編號不一樣。其中Intra_4×4模式由于塊尺寸較小,適用于編碼細節豐富的圖像,且能獲得較小的差值,但同時因其模式數目較多成為幀內編碼的一個瓶頸。論文指南。Intra_16×16模式則比較適用于圖像平坦區域的預測。

(a)(b)

圖1 幀內預測模式方向

2、幀內4×4塊預測的分析

2.1相鄰塊之間的相關性

在編碼時,只需對預測值與實際值的差值進行編碼即可,則充分利用幀內相鄰宏塊間的信息相關性來得到預測值,即是通過當前塊編解碼后的重建過程為緊鄰的下一宏塊提供預測值。具體到本文的4×4塊,相鄰的4×4塊的預測模式之間具有很強的相關性,根據當前4×4塊的左邊塊和上邊塊的預測模式可以預測當前塊的最可能模式(MPM,Most Probable Mode)。利用該相關性可以減少預測模式的選擇數目,從而可以減少編碼的比特數。

2.2RDO下全搜索(FS)的幀內預測模式選擇過程

具體的幀內模式選擇過程[3]如下:

(1)分別計算9種Intra_4×4模式的率失真代價(RD_Cost) ,選擇具有最小代價的模式。代價函數RD_Cost = SSD +λmode×Rate,其中SSD(Sum of SquaredDifference)表示當前塊與重建塊之間的差值平方和;λmode = 0.85×2(QP - 12) /3 (QP為塊的量化參數);Rate表示熵編碼后的碼率。論文指南。

(2)把16個4×4塊最小的RD_Cost相加得到當前宏塊Intra_4×4的RD_Cost。

(3)按類似方法分別計算4種Intra_16×16模式的SAD(Sum of Absolute Difference),選擇具有最小SAD的模式。計算該模式下的RD_Cost,得到當前宏塊Intra_16×16方式下的RD_Cost。

(4)比較前兩步獲得的RD_Cost,選擇具有最小RD_Cost的模式作為該宏塊的幀內預測模式。

(5)Intra_8×8色度宏塊的預測方法與亮度類似。

2.3 減小幀內預測復雜度的常用方法

為了減小幀內預測的復雜度,一般有兩種方法:(1)簡化代價函數;(2)縮小預測模式選擇的范圍。此方法可以利用當前塊及其周圍像素的某些特征,預先排除某些可能性很小的預測模式,或提前終止某些可能性小的模式的代價計算,從而降低幀內預測的復雜度。PAN Feng等利用子塊邊緣的變化方向從預選模式中選取最有可能的預測方向,算法中采用邊緣梯度直方圖的方法在幾種最有可能的預測方向中選取最佳預測方向[4];Meng Bojun等提出EIPMS算法,利用代價函數和多閾值的方法提高了4×4的子塊的編碼速度[5];文獻[6]利用下采樣方法,用RD模型替代率失真方法選擇預測模式;這些算法雖然大幅度降低了復雜度,但是因實現起來較麻煩、編碼性能有一定的損失或是圖像質量下降等問題,需要進一步的改進。

3、Intra_4×4模式選擇的快速算法

本文提出的模式選擇快速算法是基于上述所提到的兩種方法。在SAD(Sum of Absolution Difference)代價函數模型下,可以通過圖像亞采樣等方法,以代價函數的局部計算為手段達到目的。并利用當前塊及其相鄰像素的某些特征,預先排除某些可能性很小的預測模式,達到降低算法復雜度的目的。

3.1 SAD/SATD代價函數

通過計算公式(3-1),選擇值最小的所對應的模式為最佳模式。

Cost=SA(T)D+4R×λ(QP) (3-1)

其中,λ(QP)是關于QP的指數函數,4R是對使用某種預測模式后形成比特數的估計,R根據當前模式是否為最有可能的模式取值為0或1。SAD為原始圖象象素和編碼重建圖象象素的絕對值差的和。為了更加準確的計算Cost值,通常將原始圖象象素和重建圖象象素的差值進行Hadamard變換,將其轉換到變換域。

由于SATD與率失真(RD)性能有很強的相關性,所以利用SATD作為判斷準則,預先排除掉一些可能性小的預測模式降低復雜度。相鄰的4×4塊的預測模式之間具有很強的相關性,相鄰塊的關系如圖2所示,其中D是當前的4×4亮度塊,A、B和C分別為左上、上邊和左邊的4×4亮度塊。可以根據它們的預測模式確定當前4×4塊的最可能預測模式,故可以選擇相鄰4×4塊預測模式的SATD值作為閾值,預先排除掉SATD大于該閾值的模式,這樣可以預先排除大約50%的Intra4×4模式,避免了很多不必要的代價(Cost)計算,通過實現自適應閾值降低預測的計算復雜度。

引入閾值T,計算4×4塊在最可能的預測模式下的Cost4×4值,如果Cost4×4的結果小于閾值T,那么就把它作為當前4×4亮度塊的最佳預測模式;否則,繼續計算其他的預測模式。在這里閾值T的選取就是至關重要的地方,如果T較小,則不能有效的減少需要計算的預測模式數;否則如果T較大,較容易選擇“最可能的預測模式”,作為最終的結果,不能有效的找到當前塊的最佳預測模式。一般的,在圖像內容比較復雜的區域,可以適當的增大T的值;否則,應該減小T的值。另外,T的選擇與QP值的大小也有關系;當QP較大時,預測誤差較大,則應該適當的增大T的值;否則,應該減小T的值。據經驗分析,如果最可能的預測模式就是最佳預測模式,絕大多數情況下D塊的預測殘差與A或B或C塊的預測殘差十分接近。而SATD值反應的是預測模式對當前紋理結構的近似效果,所以取A、B和C塊Cost4×4值較小的一個作為D塊的Cost4×4預測期望值。再將λ(QP)的作用考慮內,我們將閾值T設定為:

篇13

由於科技日新月異,印刷已由傳統印刷走向數位印刷。在數位化的過程中,影像的資料一直有檔案過大的問題,占用記憶體過多,使資料在傳輸上、處理上都相當的費時,現今個人擁有TrueColor的視訊卡、24-bit的全彩印表機與掃描器已不再是天方夜譚了,而使用者對影像圖形的要求,不僅要色彩繁多、真實自然,更要搭配多媒體或動畫。但是相對的高畫質視覺享受,所要付出的代價是大量的儲存空間,使用者往往只能眼睜睜地看著體積龐大的圖檔占掉硬碟、磁帶和光碟片的空間;美麗的圖檔在親朋好友之間互通有無,是天經地義的事,但是用網路傳個640X480TrueColor圖形得花3分多鐘,常使人哈欠連連,大家不禁心生疑慮,難道圖檔不能壓縮得更小些嗎?如此報業在傳版時也可更快速。所以一種好的壓縮格式是不可或缺的,可以使影像所占的記憶體更小、更容易處理。但是目前市場上所用的壓縮模式,在壓縮的比率上并不理想,失去壓縮的意義。不然就是壓縮比例過大而造成影像失真,即使數學家與資訊理論學者日以繼夜,卯盡全力地為lossless編碼法找出更快速、更精彩的演算法,都無可避免一個尷尬的事實:壓縮率還是不夠好。再說用來印刷的話就造成影像模糊不清,或是影像出現鋸齒狀的現象。皆會造成印刷輸出的問題。影像壓縮技術是否真的窮途末路?請相信人類解決難題的潛力是無限的。既然舊有編碼法不夠管用,山不轉路轉,科學家便將注意力移轉到WAVELET轉換法,結果不但發現了滿意的解答,還開拓出一條光明的坦途。小波分析是近幾年來才發展出來的數學理論。小波分析,無論是作為數學理論的連續小波變換,還是作為分析工具和方法的離散小波變換,仍有許多可被研究的地方,它是近幾年來在工具及方法上的重大突破。小波分析是傅利葉(Fourier)分析的重要發展,他保留了傅氏理論的優點,又能克服其不足之處??蛇_到完全不失真,壓縮的比率也令人可以接受。由於其數學理論早在1960年代中葉就有人提出了,而到現在才有人將其應用於實際上,其理論仍有相當大的發展空間,而其實際運用也屬剛起步,其後續發展可說是不可限量。故研究的動機便由此而生。

貳、WAVELET的歷史起源

WAVELET源起於JosephFourier的熱力學公式。傅利葉方程式在十九世紀初期由JosephFourier(1768-1830)所提出,為現代信號分析奠定了基礎。在十九到二十世紀的基礎數學研究領域也占了極重要的地位。Fourier提出了任一方程式,甚至是畫出不連續圖形的方程式,都可以有一單純的分析式來表示。小波分析是近幾年來才發展出來的數學理論為傅利葉方程式的延伸。

小波分析方法的提出可追溯到1910年Haar提出的小波規范正交基。其後1984年,法國地球物理學J.Morlet在分析地震波的局部性質時,發現傳統的傅利葉轉換,難以達到其要求,因此引進小波概念於信號分析中,對信號進行分解。隨後理論物理學家A.Grossman對Morlet的這種信號根據一個確定函數的伸縮,平移系{a-1/2Ψ[(x-b)/a];a,b?R,a≠0}展開的可行性進行了研究,為小波分析的形成開了先河。

1986年,Y.Meyer建構出具有一定衰減性的光滑函數Ψj,k(x),其二進制伸縮與平移系{Ψj,k(x)=√2jΨ(2jx-k);j,k?Z}構成L2(R)的規范正交基。1987年,Mallat巧妙的將多分辨分析的思想引入到小波分析中,建構了小波函數的構造及信號按小波轉換的分解及重構。1988年Daubechies建構了具有正交性(Orthonormal)及緊支集(CompactlySupported);及只有在一有限區域中是非零的小波,如此,小波分析的系統理論得到了初步建立。

三、WAVELET影像壓縮簡介及基礎理論介紹

一、WAVELET的壓縮概念

WAVELET架在三個主要的基礎理論之上,分別是階層式邊碼(pyramidcoding)、濾波器組理論(filterbanktheory)、以及次旁帶編碼(subbandcoding),可以說wavelettransform統合了此三項技術。小波轉換能將各種交織在一起的不同頻率組成的信號,分解成不相同頻率的信號,因此能有效的應用於編碼、解碼、檢測邊緣、壓縮數據,及將非線性問題線性化。良好的分析局部的時間區域與頻率區域的信號,彌補傅利葉轉換中的缺失,也因此小波轉換被譽為數學顯微鏡。

WAVELET并不會保留所有的原始資料,而是選擇性的保留了必要的部份,以便經由數學公式推算出其原始資料,可能不是非常完整,但是可以非常接近原始資料。至於影像中什度要保留,什麼要舍棄,端看能量的大小儲存(跟波長與頻率有關)。以較少的資料代替原來的資料,達到壓縮資料的目的,這種經由取舍資料而達到壓縮目地的作法,是近代數位影像編碼技術的一項突破。即是WAVELET的概念引入編碼技術中。

WAVELET轉換在數位影像轉換技術上算是新秀,然而在太空科技早已行之有年,像探測衛星和哈柏望遠鏡傳輸影像回地球,和醫學上的光纖影像,早就開始用WAVELET的原理壓縮/還原影像資料,而且有壓縮率極佳與原影重現的效果。

以往lossless的編碼法只著重壓縮演算法的表現,將數位化的影像資料一絲不漏的送去壓縮,所以還原回來的資料和原始資料分毫無差,但是此種壓縮法的壓縮率不佳。將數位化的影像資料轉換成利於編碼的資料型態,控制解碼後影像的品質,選擇適當的編碼法,而且還在擷取圖形資料時,先幫資料「減肥。如此才是WAVELET編碼法主要的觀念。

二、影像壓縮過程

原始圖形資料色彩模式轉換&n

bsp;DCT轉換量化器編碼器編碼結束

三、編碼的基本要素有三點

(一)一種壓縮/還原的轉換可表現在影像上的。

(二)其轉換的系數是可以量化的。

(三)其量化的系數是可以用函數編碼的。

四、現有WAVELET影像壓縮工具主要的部份

(一)WaveletTransform(WAVELET轉換):將圖形均衡的分割成任何大小,最少壓縮二分之一。

(二)Filters(濾鏡):這部份包含WaveletTransform,和一些著名的壓縮方法。

(三)Quantizers(量化器):包含兩種格式的量化,一種是平均量化,一種是內插量化,對編碼的架構有一定的影響。

(四)EntropyCoding(熵編碼器):有兩種格式,一種是使其減少,一種為內插。

(五)ArithmeticCoder(數學公式):這是建立在AlistairMoffat''''slineartimecodinghistogram的基礎上。

(六)BitAllocation(資料分布):這個過程是用整除法有效率的分配任何一種量化。

肆、WAVELET影像壓縮未來的發展趨勢

一、在其結構上加強完備性。

二、修改程式,使其可以處理不同模式比率的影像。

三、支援更多的色彩。可以處理RGB的色彩,像是YIQ、HUV的色彩定義都可以分別的處理。

四、加強運算的能力,使其可支援更多的影像格式。

五、使用WAVELET轉換藉由消除高頻率資料增加速率。

六、增加多種的WAVELET。如:離散、零元樹等。

七、修改其數學編碼器,使資料能在數學公式和電腦的位元之間轉換。

八、增加8X8格的DCT模式,使其能做JPEG的壓縮。

九、增加8X8格的DCT模式,使其能重疊。

十、增加trelliscoding。

十一、增加零元樹。

現今已有由中研院委托國內學術單位研究,也有不少的研究所的碩士。國外更是如火如荼的展開研究。相信實際應用於實務上的日子指日可待。

伍、影像壓縮研究的方向

1.輸入裝置如何捕捉真實的影像而將其數位化。

2.如何將數位化的影像資料轉換成利於編碼的資料型態。

3.如何控制解碼影像的品質。

4.如何選擇適當的編碼法。

5.人的視覺系統對影像的反應機制。

小波分析,無論是作為數學理論的連續小波變換,還是作為分析工具和方法的離散小波變換,仍有許多可被研究的地方,它是近幾年來在工具及方法上的重大突破。小波分析是傅利葉(Fourier)分析的重要發展,他保留了傅氏理論的優點,又能克服其不足之處。

陸、在印刷輸出的應用

WAVELET影像壓縮格式尚未成熟的情況下,作為印刷輸出還嫌太早。但是後續發展潛力無窮,尤其在網路出版方面,其利用價值更高,WAVELET的出現就猶如當時的JPEG出現,在影像的領域中掀起一股旋風,但是WAVELET卻有JPEG沒有的優點,JPEG乃是失真壓縮,且解碼後復原程度有限,能在網路應用,乃是由於電腦的解析度并不需要太高,就可辨識其圖形。而印刷所需的解析度卻需一定的程度。WAVELET雖然也是失真壓縮,但是解碼後卻可以還原資料到幾乎完整還原,如此的壓縮才有存在的價值。

有一點必須要提出的就是,并不是只要資料還原就可以用在印刷上,還需要有解讀其檔案的RIP,才能用於數位印刷上。等到WAVELET的應用成熟,再發展其適用的RIP,又是一段時間以後的事了。

在網路出版上已經有瀏覽器可以外掛讀取WAVELET檔案的軟體了,不過還是測試版,可是以後會在網路上大量使用,應該是未來的趨勢。對於網路出版應該是一陣不小的沖擊。

圖像壓縮的好處是在於資料傳輸快速,減少網路的使用費用,增加企業的利潤,由於傳版的時間減少,也使印刷品在當地印刷的可能性增高,減少運費,減少開支,提高時效性,創造新的商機。

柒、結論

WAVELET的理論并不是相當完備,但是據現有的研究報告顯現,到普及應用的階段,還有一段距離。但小波分析在信號處理、影像處理、量子物理及非線性科學領域上,均有其應用價值。國內已有正式論文研究此一壓縮模式。但有許多名詞尚未有正式的翻譯,各自有各自的翻譯,故研究起來倍感辛苦。但相信不久即會有正式的定名出現。這也顯示國內的研究速度,遠落在外國的後面,國外已成立不少相關的網站,國內僅有少數的相關論文。如此一來國內要使這種壓縮模式普及還有的等。正式使用於印刷業更是要相當時間。不過對於網路出版仍是有相當大的契機,國內仍是可以朝這一方面發展的。站在一個使用其成果的角度,印刷業界也許并不需要去了解其高深的數理理論。但是在運用上,為了要使用方便,和預估其發展趨勢,影像壓縮的基本概念卻不能沒有。本篇文章單純的介紹其中的一種影像壓縮模式,目的在為了使後進者有一參考的依據,也許在不久的將來此一模式會成為主流,到時才不會手足無措。

參考文獻:

1.Geoff&nb

sp;Davis,1997,WaveletImageCompressionConstructionKit,。

2.張維谷.小宇宙工作室,初版1994,影像檔寶典.WINDOWS實作(上),峰資訊股份有限公司。

3.張維谷.小宇宙工作室,初版1994,影像檔寶典.WINDOWS實作(下),峰資訊股份有限公司。

4.施威銘研究室,1994,PC影像處理技術(二)圖檔壓縮續篇,旗標出版有限公司。

5.盧永成,民八十七年,使用小波轉換及其在影像與視訊編碼之應用,私立中原大學電機工程學系碩士學位論文。

6.江俊明,民八十六年,小波分析簡介,私立淡江大學物理學系碩士論文。

7.曾泓瑜、陳曜州,民八十三年,最新數位訊號處理技術(語音、影像處理實務),全欣資訊圖書。

附錄:

嵌入式零元樹小波轉換、階層式嵌入式零元樹小波轉換、階層式影像傳送及漸進式影像傳送

目前網路最常用的靜態影像壓縮模式為JPEG格式或是GIF格式等。但是利用這些格式編碼完成的影像,其資料量是不變的,其接受端必須完整地接受所有的資料量後才可以顯示出編碼端所傳送的完整影像。這個現象最常發生在利用網路連結WWW網站時,我們常常都是先接收到文字後,其網頁上的圖形才,慢慢的一小部份一小部份顯示出來,有時網路嚴重塞車,圖形只顯示一點點後就要再等非常久的時間才再有一點點顯示出來,甚至可能斷線了,使得使用者完全不知道在接收什麼圖案的圖形,無形中造成網路資源的浪費。此缺點之改善,可以使用嵌入式零元樹小波轉換(EZW)來完成。

階層式影像傳送系統的主要功能為允許不同規格之顯示裝置或解碼器可以從同一編碼器中獲得符合其要求之訊號,如此不需要對於不同的解碼器設計不同的編碼器配合利用之,進而增加了其應用的范圍,及減低了所架設系統的復雜度,也可以節省更多的設備費用。利用Shapiro所提出的嵌入式零元樹小波轉換(EZW)技術來設計階層式影像傳送系統時,其編碼的效果不是很好。主要的原因是,利用(EZW)技術所設計的編碼器是根據影像的全解析度來加以編碼的,這使得擁有不同解析度與碼率要求的解碼器,無法同時分享由編碼器所送出來的位元流。雖然可以利用同時播放(Simulcast)技術來加以克服之,但是該技術對於同一影像以不同解析度獨立編碼時,將使得共同的低通次頻帶(LowpassSubband)被重復的編碼與傳送,而產生了相當高的累贅(Redundancy)。

基於上述情況,有人將嵌入式零元樹小波轉換(EZW)技術加以修改之,完成了一個新式的階層式影像傳送系統。該技術為階層式嵌入的零元樹小波轉換(LayeredEmbeddedZerotreeWavelet,簡稱LEZW技術。這個技術使我們所設計出來的階層式影像傳送系統,可以在編碼傳送前預先指定圖層數目、每層影像的解析度與碼率。

LEZW技術是將EZW技術中的連續近似量化(SAQ)加以延伸應用之,而EZW傳統的做法是將SAQ應用於全部的小波轉換系數上。然而在LEZW技術中,從基層(BaseLayer)開始SAQ一次僅用於一個圖層(Layer)的編碼,直到最高階析度的圖層為止。當編碼的那一圖層碼率利用完時,即表示該圖層編碼完畢可以再往下一圖層編碼之。為了改善LEZW的效率,在較低圖層的SAQ結果應用於較高圖層的SAQ過程中,基於這種編碼的程序,LEZW演算法則可以在每一圖層平均碼率的限制下,重建出不同解析度的影像。因此,LEZW非常適合用於設計階層式影像傳送系統。

91综合网人人