字體:小 中 大 | |
|
|
2015/02/04 20:02:59瀏覽741|回應3|推薦11 | |
. 〈數位化之為物〉 【數位化】(digitizing, digitization)就是把形式為類比的東西轉變成形式為數位的東西,轉變之後內容不變,圖像還是圖像,聲音還是聲音,攝氏39度的日子還是那麼熱,衹是那些“東西”的外表變了。 哪些“東西”?什麼“東西”?哪些“東西”的形式為類比? —– 所有的屬於物理世界的連續訊號以及可以被視為物理世界連續訊號的東西。 數位化這個詞有廣狹兩個意思。狹義就是指把類比訊號轉換成數位訊號,這是從訊號的角度來說,這也是嚴格的定義。 訊號是個日常用詞。行為語言是訊號,這種訊號經常衹是單獨的訊號,並不連續。打旗語是在發訊號,這通常是連續訊號,但訊號之間的時間間隔不必精確地固定。無線電視臺發送攜帶節目內容的訊號電波,電波的頻率固定而且高度精確,所以這種訊號的連續性非常好。 在物理世界,【訊號】指一個其性質和作用為代表、攜帶、並傳送資訊的變動物理量,在詞性上指一個包含許多變值(也就是訊號值)的整體。這個物理量經常是電的量,如電壓、電流、電磁場強度,但不必然是,比方氣壓、水壓、音壓、溫度、光強度都可以。這個物理量隨時間而變,聲音訊號就是這樣。平面圖像的資訊沒有時間向度,不過平面圖像可以視為一種隨平面向度而變的二維訊號。 在物理學,連續訊號這個詞裡的“連續”有特別的意思,這個“連續”的準確含義包括兩方面:時間的變動是連續的,不存在天然的斷開點;物理量(也就是訊號值)的變動也是連續的,不存在天然的斷開點。符合這兩個條件的物理訊號才是【連續訊號】。 自然界裡隨時間而變的各種物理訊號差不多都是連續訊號。在時間連續方面,連續訊號的相鄰訊號很難分割 —– 雷聲暴起,五秒鐘之後完全隱去,雷聲的訊號怎麼分割?在訊號值連續方面,連續訊號的相鄰訊號值之間的變動是連續的(continuous)而不是級進的(stepwise)。訊號值連續變動的情況畫成圖是上上下下的平滑曲線,級進變動畫成圖是上上下下的階梯。 為什麼叫“類比”?因為這種連續訊號的量值變動貼附於另一種依時間而變的連續訊號。空氣裡的聲波有音壓變化,麥克風把音壓的變化轉變成電流或電壓的變化,電訊號的強弱變化緊隨音壓的強弱變化,同步,成比例,呈現一種類比或模仿的關係,所以這樣的電訊號就被稱為【類比訊號】。在喇叭那一端,電訊號被轉回成聲波,二者的關係還是類比,這時候音壓訊號是類比訊號。轉來轉去情況相同,互為主從,因此這兩種訊號都是類比訊號。 連續訊號都可以“被類比”,所造成的訊號被稱為類比訊號,然後這個類比訊號可以繼續“被類比”,在這樣的過程中訊號物理量的種類被轉換了,比如音壓被轉換成電流,電壓被轉換成光強度,然而訊號的內容(也就是連串的訊號值所代表、攜帶、並傳送的資訊)沒有變。連續訊號是個本質稱呼,類比訊號是個應用稱呼,類比訊號都是連續訊號。 那麼什麼叫“數位訊號”? 對連續訊號取樣,然後把所有的樣本的量值都從十進制轉換成二進制,這樣就把類比訊號轉變成【數位訊號】了。 類比訊號是連續訊號,數位訊號是不連續訊號。連續訊號在時間變動和訊號值變動這兩方面都不存在天然的斷開點,不連續訊號的情況就是用人為的方式把連續訊號在這兩方面的連續狀態解離成離散狀態。方式衹有一個,就是取樣。取樣是一種數學手段。 在平面直角坐標系上,每一個點都有x和y兩個坐標值。橫坐標是時間,縱坐標是訊號值,類比訊號是一條平滑的曲線。點連成線,但點本身沒有大小,所以這條平滑曲線由無限多個點構成,所以要解離連續訊號的時間連續性就衹能靠取樣。衹要取樣頻率夠高,【規律取樣】可以保證靠樣本重建出來的曲線在每一個點都非常逼近原始曲線。取多少樣本才叫夠多?要看情況,要看目的,考慮因素很多 —– 這是應用數學。至於為什麼要解離連續訊號的時間連續性?為了便於操作連續訊號。連續訊號是自然現象,高智生物研究未知,開物成務,總是要搞搞弄弄伸手出腳的。從石油裡玩出塑膠,事先也沒有人知道。 訊號值隨時間而變,時間連續性解離了,被取成樣本的訊號值之間也就失去連續性了,因為規律取樣的過程把相鄰樣本之間本來存在的點都過濾掉了。拿十塊石板排起來當成一塊,在上面雕刻一首詩,然後規律取樣逢三取一,留下了第三、第六、第九這三塊石板,再把這三塊石板依序排起來,雕在石板上的字句就不連續了,平滑曲線就變成階梯了。道理就這樣。 連續訊號經過取樣就成為不連續訊號,也就是【離散訊號】。離散訊號要經過量化才成為數位訊號。【數位化】包括兩部份:離散化、量化。離散化+量化就是【類比到數位的轉換】(analog-to-digital conversion, ADC)。 【量化】(quantization)也是一種數學手段,在這裡專指把用十進制表示的訊號值轉換成二進制數值。 取樣之後,訊號已經離散,訊號值已經可以操弄了,為什麼還要把它轉換成二進制? 量化的原始目的衹有一個,就是要利用威力驚人的全電子數位計算機來處理數量龐大到驚人的數據。早期的全電子數位計算機主要被用在科學計算和軍事方面,原因正是這些方面的計算工作所涉及的數據量龐大到類比計算機沒法應付。按照CD聲訊的規格,取樣率是44.1 kHz。如果錄音的時候就照這個取樣率辦事,那麼每秒要取四萬多個聲音樣本,而且記錄樣本值是隨取隨記。要是沒有電腦,這就是天方夜譚。要是有電腦而不用,那就是不可思議。要用電腦做事,就必須先把用十進制表示的數值轉換成二進制數值,因為這個腦子衹懂010011101…… ^@@^ 廣義來說,或者寬鬆地說,數位化指的是把一個東西或訊號表達成離散形式,這是從資訊的角度來說。物理訊號是代表資訊的變動物理量,既然物理訊號以外的東西也可以,而且量化被排除在條件之外,那麼,被包容進來的新的可輸入物就衹能是非數字的符號序列,因為不能直接違反數位化的嚴格定義。這個用法實際所指的情況是【電腦化的資訊處理】。類比計算機用處有限,數位計算機潛力無窮,情況從一開始就是這樣。電腦模仿人腦,為人代勞,威力日益強大,除了能包辦人類日常的數字計算工作之外,顯然也有能力承擔人類日常的資訊處理工作中比較機械的部份。由於資訊的涵括範圍不限於數字,所以數位化的定義就放寬了。 【資訊】指東西或事件的內容,在日常用語的層次指數據或消息所包含的意義。情況很明顯:其性質和作用為代表、攜帶、並傳送資訊的東西太多了,不止是變動物理量 —– 一般訊號、一般數字、符號集、音樂旋律、圖畫、語言、文字也都是資訊的本源載體(實體載體如大腦、RAM、黏土板、樹皮、紙張、底片、錄影帶、CD、等等是另一個層面的事)。字母集本來就是離散的,一個一個的漢字本來就不連續,要把這些成套的人造資訊數位化,衹要按著既定次序給這些符號集的每一個成員一個二進制數值作為代號就好了。 這些被分派為代號的二進制數值都是數位數據。數據是以數字為形式的資訊。【數位數據】指的是被表達成離散形式的一個東西或訊號或資訊,可以是整體稱也可以是個別稱。數位數據在個別形式上是數字,整體而言是離散的,然而被數位數據所代表的資訊可能是離散的(如字母),也可能是連續的(如聲音)。一個為了數位計算而被轉換出來的二進制數據當然是一個數位數據,一個為了數位表達而被指定出來的二進制數據也是一個數位數據。 數位資訊都是離散資訊,這麼說衹是著眼於數位資訊的數學性質。符號集並不連續,漢字庫所代表的資訊本來就不連續,所以把這樣的資訊轉變成數位資訊不需要取樣及量化。 回到訊號的領域。類比訊號是天然的,數位訊號是人造的。這是說人這種高智生物以智能把類比訊號“變形成”或“重新造成”數位訊號。這樣做衹是改變了訊號的形式,訊號的內容沒有變。 —– 那麼為什麼要多此一舉?因為數位訊號比較不受干擾(因為外來干擾所產生的雜訊不會自動量化,但大干擾可能會把數位訊號裡的沒有弄成有,也就是把0搞成1),計算時比較不容易出錯(因為個別的數值不是0就是1,而這等於不是有就是沒有,不需要比大小),傳輸時比較可靠(因為可以自動偵錯自動改正),還可以壓縮(類比訊號沒法壓縮),更便於操作處理、儲存、複製、傳輸,好處太多太大而缺點有限。而且,功能相同的機器,以數位為工作原理的比以類比為工作原理的在構造上簡單得多,所以數位機器比類比機器容易設計,容易製造,也容易修理。而且,數位數據交給電腦操作,那真是銀鞍照白馬,颯沓如流星。 —– 而且,事實上,歷史說沒有數位化就沒有電腦,就沒有CD,就沒有mp3,就沒有Word,就沒有email,就沒有Internet,就沒有Blu-ray,就沒有臉書,就沒有滑世代,就不會有很多人的快樂人生~~~ ^_____^ . |
|
( 知識學習|科學百科 ) |