Monday, September 22, 2008

定義

2008/9 Jack. 實驗步驟

目的:

對於網路日漸盛行的 YouTube、無名等提供開放使用者上傳影音資訊存放而侵犯電影等相關版權議題,研究如何高速影像序列判讀,快速搜尋出兩段相同的影像序列。

實驗步驟:
  • 取得影像:
    • 目前以 解壓 MotionJPEG 作為目標,以方便取得影像為主,並容易將Decode 流程改進,增加比對速度。

  • 單一影像處理:
    • 縮小化影像:原始影像為640x480, 縮小至160x120。
    • 取灰階影像:
      • JPEG、MPEG都是以YUV作為影像基礎,取其Y(亮度值)即可。
      • 在Decode 時即可省略U/V Decode,並合併第一步驟並省略不需要的Y值Decode程序。
    • 取二值化影像:
      • 二值化為黑白影像,取出大部輪廓。
      • histogram 運用,是否需要?必須整張影像運算,耗時。
      • 微分、Laplace 取灰階影像,並取得輪廓。( 這部分運算較高,也許僅作二值化取代)。
      • 二階微分(Laplace)。
      • Prewitt。
    • 其中依影像內容在實驗中,可能需要先期作下列演算法運算
      • 細線化:將細部輪廓描述出來。
        • Hilditch。
        • 遮罩方式、斷線、侵蝕問題。
      • 膨脹化:將輪廓清晰 ( 膨脹+ 收縮 所需運算較中值少)。
        • 膨脹。
        • 收縮。
        • 中值濾波。
    • 輪廓比對:其中有幾種方式。
      • 最簡單方式:影像直接取差,求得Distortion,依失真率判定影像是否相同。
      • 較複雜方式:特徵值、標籤化的運用,目前尚未想到如何運用比較恰當,且比直接取差更有效率。

  • 連續影像處理:
    • 方法一:longest common subsequence、LCS:不用連續。O(n^2)
    • 方法二:Longest Common Substring:連續 ,O(m+n)。
    • 方法三:先將A影像序列作分類,在一定的相似度下的影像歸為一個群組,然後將B影像依序與A的每個群組其中一張影像與B影像作比對。


Questions:
  1. 這些影像技術幾乎都是現有的技術,只是將集合起來並串起來運用,應該如何從中找到能發表的論文?
  2. 目前似乎沒有這類可比對的數據、或是參考的應用,如果要針對某個細項去找題目,哪個點較容易發揮?
  3. 為了寫出較能自行控制Decode 流程的 Decoder,目前還在JPEG Spec 上打轉,預計暑假結束前能完成一個基本Decoder ,並處理縮小化、灰階運算。

Reference:

No comments: