早期沒有圖形介面時,在電腦上想使用文字模式顯示圖像,一種方式是透過ASCII可見字元來呈現圖像內容。在圖形介面早就普及的現在,這種顯示圖像的方式被視為一種文字藝術,你可以在維基百科〈ASCII藝術〉條目中,看到維基百科圖示的ASCII藝術,實際上,字元並沒有灰階值的差別,然而視覺上卻以為是張灰階圖。

基於半色調、藍雜訊來實現圖片取樣

這類ASCII藝術的實現不難,我們可將圖片轉為灰階,再將灰階值四對應某個字元,而常見的字元組合會是:「$@B%8&WM#*oahkbdpqwmZO0QLCJUYXzcvunxrjft/\|()1{}[]?-_+~<>i!lI;:,"^`\'.」(.後方有個空白字元)顯示ASCII時,建議使用等寬字型。

之所以覺得有灰階效果,是因為字元串由左而右的字元越來越簡單,以印刷技術而言,可看成墨點大小的變化,而藉由大小組合,能在視覺產生灰階效果。

這其實是半色調(Halftone)的應用變化。通常半色調是相對於連續調(continue tone),連續調是指圖像基本元素(例如像素)本身含有顏色的深淺,可建立連續的顏色變化,例如灰階值的連續性。半色調的基本元素只有兩種狀態:有色或無色,藉由改變元素的大小或頻率,來模擬明暗變化,你應該常看過這種半色調印刷的應用場合,也就是漫畫。

如果想看看Python的實現,可以參考〈ASCII Art文字藝術〉,其中的每個像素,就是一個取樣點,取樣點間的距離固定,灰階值會對應至某個字元,由於字元簡單或複雜,相當於改變基本元素的大小來實現半色調,這稱為調幅加網(AM Screening)。

相對地,若元素大小固定,但鄰近取樣點之間的距離是依照灰階值來決定,也就是在一定範圍內,依照灰階值來決定取樣點的頻率,就稱為調頻加網(FM Screening),例如目前取樣點若較黑,候選的鄰近取樣點就較近,反之較遠,問題在於決定遠近範圍後,接下來該如何在範圍內決定取樣點位置。

隨機取樣點?

第一個想法是在範圍內隨機取樣。若範圍為r,在以r為半徑的圓範圍內隨機取樣,這牽涉兩個問題:

第一是圓內取樣方式,單純讓半徑隨機於0到 r,角度隨機於0到360來取樣是錯的,這會造成接近圓心的取樣點過密,關於這部分,你應該看看〈Disk Point Picking〉有關圓內隨機點分布說明。

若圓內每個點的取樣機率一致,單純隨機取樣面臨的第二問題出現,也就是疊頻(Aliasing)。簡單來說,兩個取樣點各自隨機決定的鄰近取樣點,距離可能過近甚至重疊,因而造成取樣後的結果,會有過疏或過密的區域。

可以想像如何在圖片上散布雜訊?雜訊值與像素值相加後,高於某值不取樣,低於某值就取樣,而隨機散布雜訊,概念相當於散布白雜訊(white noise),可簡單理解為:各雜訊值各自的總數是差不多的(相當於光線中各頻率的光強度差不多)。

若想避免取樣點間距離過近或重疊,我們可能直覺想到的是:檢查新取樣點與既有取樣點間是否保持適當距離,若能做到這點,取樣點的散佈方式,概念上相當於藍雜訊(blue noise)。你可以在維基百科〈雜訊的顏色〉條目中看到藍雜訊的頻譜,再想像成雜訊值各自的總數也呈現相同的趨勢。

一個有趣的事實是,視網膜細胞的排列方式也呈現出藍雜訊的特徵,或許是半色調能在視覺造成灰階效果的原因。視網膜細胞數量龐大,但畢竟是細胞,仍須有一定的大小,若在每個細胞位置畫點,點與點會有一定距離,不會太近,也不會太遠(畢竟要在有限範圍容納龐大數量細胞),由於取樣點的分布符合Poisson分布,又稱為Poisson Disk取樣。

Poisson Disk取樣

想讓取樣點之間有一定的距離範圍,直覺想法是生成新取樣點時,與既有的全部取樣點進行距離檢查,不過這需要龐大的運算。

為了改善這樣的效能問題,有許多方式,例如,Cem Yuksel的Weighted Sample Elimination,先產生一堆隨機點,然後基於KD-tree,以空間分割的方式,來取得鄰近點,並消去相鄰過近的點;Robert Bridson的〈Fast Poisson Disk Sampling in Arbitrary Dimensions〉,由於速度快且實作簡單,成為常見的解決方案。

以二維圖像來說,Bridson的做法是,將圖像分割為棋盤式的格子,每格只允許一個採樣點,因此,若採樣點之間最近距離只能是r,那麼格子的寬度就是r/sqrt(2),Bridson可以擴展至n維,這時空間大小的單位就是r/sqrt(n)。

開始進行取樣時,取樣清單中加入第一個點,置入對應的格子裡,並將該點加入一個活動點清單,接著開始迭代,每次從活動點清單中隨機取得一個活動點,然後試著在r到2r的環狀範圍裡取k個點,由於每格只允許一個採樣點,這k個點只要看看活動點的九宮格內,是否出現了小於r的點,不用去檢查全部既有的取樣點,從而避免了方才的效能問題。

在Bridson的論文裡談到,k通常取為30就可以了。如果k個取樣點都不合格,作廢當時的活動點,下次迭代就不會拿來作為取樣基礎,而如果k個點有若干點符合資格,Bridson並未明確說明該怎麼做,只說加入取樣清單與活動點清單,也就是,後續的取樣點可以基於此次的取樣點作為基礎。

關於k個點有若干點符合資格的處理,網路上有人說採距離最長的,有人說取最短的,實際試過兩種後,我發現採用距離最短的取樣點,密度比較高,另外,由於每個新取樣點都是從活動點衍生出來,若將活動點與衍生點連接成線,可得到樹狀圖,取最短距離作為取樣點時,樹狀圖不易出現交樹枝交叉,可以參考〈poisson-disc-sampling.js〉,這是使用p5.js的實作。

我也嘗試過將只取第一個合格點,或全部適用的新取樣點都納入的實現,若不在乎密度也不考量樹枝交叉的問題,這能加快整個圖像的取樣速度,最後結果看來,距離分布也還算均勻。正如方才談到的,k通常取30就可以了,太大沒意義,太小的話,容易k個取樣點都不合格,導致無法涵蓋整個範圍。

對此,《The Nature of Code》的作者在〈Poisson-disc Sampling〉有段教學影片,循序漸近實現Poisson Disk取樣,有興趣可以看看。

多樣的應用

若想實際應用至半色調,在考量新取樣點時,可以將取樣點灰階值納入考量,當灰階值差異過大時,建立一棵新的取樣樹,取樣距離r根據新的取樣點灰階值設置,也就是整張圖像的取樣,可以是多棵取樣樹組成,多棵取樣樹的基本建立方式,我在〈poisson-trees.js〉有個簡單的p5.js實作可以參考。

除了半色調應用,Poisson Disk取樣也可用於彩色圖片的取樣,結果會構成點彩畫派(Pointillism)的風格,也就是用很粗的彩點堆砌,創造整體形象的油畫繪畫方法。

或者,我們可以將取樣點作為Voronoi分割的依據,取樣的顏色填滿分割後的凸邊形,構成圖像的晶格化效果。想看到更多這類作法,可以試著搜尋「blue noise」、「Poisson Disk」的圖片,將會看到許多相關的圖像處理應用。

專欄作者


熱門新聞

Advertisement