信息熵與二進(jìn)制--信息論系列x
發(fā)布時(shí)間:2020-08-29 來源: 事跡材料 點(diǎn)擊:
信息熵與二進(jìn)制-- 信息論系列 為什么信息技術(shù)中要用二進(jìn)制處理數(shù)據(jù),難道僅僅是由于晶體管易于實(shí)現(xiàn)二進(jìn)制嗎?其實(shí)很多人都知道,在晶體管出現(xiàn)前很長時(shí)間,電報(bào)就是用的二進(jìn)制,其實(shí)即使那不是真正的二進(jìn)制,因?yàn)殡妶?bào)的二進(jìn)制沒有定義運(yùn)算,即便如此,人們還是傾向于用兩個(gè)符號來對大量的字符進(jìn)行編碼,這個(gè)意義上說,二進(jìn)制只不過是這種雙符號的電報(bào)(.和_)定義了運(yùn)算的高級形式而已,不考慮運(yùn)算只考慮編碼,電報(bào)的雙符號和現(xiàn)在二進(jìn)制編碼十分相似,這時(shí)就要問了,人們?yōu)楹尾挥酶嗟姆栠M(jìn)行編碼,而只用兩個(gè)符號,這就是信息熵的問題了。
用兩個(gè)符號進(jìn)行編碼使得識(shí)別更加容易,如果把每一個(gè)數(shù)據(jù)位的可能值作為一種狀態(tài),那么十進(jìn)制數(shù)的每一位就有十種狀態(tài),而二進(jìn)制數(shù)據(jù)的每一位只有兩種狀態(tài),初看起來,十進(jìn)制的數(shù)據(jù)記載的信息量更大,可是正式由于這種很大的信息量導(dǎo)致十進(jìn)制的數(shù)據(jù)更加不易識(shí)別,不易識(shí)別就是說需要我們付出更大的努力才能識(shí)別,用熱力學(xué)的術(shù)語說就是信息的熵過大,舉個(gè)例子說明為何信息量大的數(shù)據(jù)更加不易識(shí)別,如果是二進(jìn)制的數(shù),如果有一位丟失了或者寫得不清,那么我們有百分之五十的幾率可以猜中,但是如果一個(gè)十進(jìn)制的數(shù)據(jù)位丟失了,那么我們只有百分之十的幾率猜中它,這就是實(shí)質(zhì)。信息熵代表的是一種無序度,無序度越大,它承載的信息越多,我們想理解它就需要更多的努力,這該作何理解呢?我們面對一個(gè)未知的事物時(shí),我們說它是無序的,混亂的,你對它完全未知它就是完全混亂完全無序,你對它部分未知,那么它就是部分混亂部分無序,你理解它的過程就是你得到信息的過程,就是你將該事物一個(gè)個(gè)無序的狀態(tài)變成有序的過程,最終一切都成了有序的,那么你對該事物就完全理解了,因此你就得到了信息,因此信息量是相對于你對該信息的無知而言的,你對它越無知,那么它就越無序,它對你來講信息量越大,引用一句話“熵,是物理名字,在信息論里則叫信息量。從控制論的角度來看,應(yīng)叫不確定性。當(dāng)我們不知道某事物具體狀態(tài),卻知道它有幾種可能性時(shí),顯然,可能性種類愈多,不確定性愈大。不確定性愈大的事物,我們最后確定了、知道了,這就是說我們從中得到了愈多的信息,也就是信息量大。”其實(shí)這也是和熱力學(xué)有關(guān)系的,因?yàn)樵谀憷斫庑畔⒌臅r(shí)候,你的大腦要耗氧,這時(shí)產(chǎn)生的熱量還是增加了熱力學(xué)的熵,你理解的信息越多也就是信息量越大信息熵越大,那么你的大腦耗氧將越多,產(chǎn)生的熱量將越多,其實(shí)信息熵只是熱力學(xué)熵的一個(gè)抽象投影而已。我們知道,理解二進(jìn)制信息時(shí)我們付出的努力沒有理解十進(jìn)制時(shí)的多(我們猜對的幾率大),因此二進(jìn)制就成了信息系統(tǒng)的首選,但是這只是選用二進(jìn)制的原因之一,這里還要說明的是,以上僅僅是理解的一種方式,其實(shí)不要忘了,雖然十進(jìn)制數(shù)據(jù)誤碼率高,但是它確實(shí)可以承載更多的信息,比如一個(gè)數(shù)字 9,用十進(jìn)制一個(gè)位就可以,用二進(jìn)制需要 4 個(gè)位,誤碼率乘以四不一定更低,幸運(yùn)的是,信息論的主體不是人,而是機(jī)器,機(jī)器是善于按位運(yùn)算的,而且,信息熵也是理解一位的信息熵,因此二進(jìn)制在這個(gè)意義上是首選。況且二進(jìn)制的數(shù)字更容易被分辨,分辨系統(tǒng)設(shè)計(jì)更加容易,只需要識(shí)別兩種狀態(tài)足矣,沒有第三種狀態(tài)來攪局。
信息量大即信息熵高難道不是好事嗎?其實(shí)對于結(jié)果來說是好事,畢竟我們的世界現(xiàn)在已經(jīng)嚴(yán)重依賴于信息,但是對于我們理解信息來說,我們需要付出的會(huì)更多,但是如果對于信息熵少的系統(tǒng),想擁有同樣的信息量的話,必然需要更多次的仲裁才可以,因此總體上二進(jìn)制信息的熵值低并不是它被選中的理由,但是僅憑一次仲裁中,二進(jìn)制信息更容易被識(shí)別,更不易出錯(cuò),得到正確結(jié)果更容易這些原因,它就應(yīng)該被選中,畢竟誰不是一步一步處理信息的呢?雖然處理信息的主體是機(jī)器,它也是一步一步處理信息的,單步的性能更加有意義,它直接關(guān)系到處理器的發(fā)熱,因?yàn),信息的獲得將最終統(tǒng)一到熱力學(xué)的熱熵。
選用二進(jìn)制的另一個(gè)原因就是,它確實(shí)占用了最少的狀態(tài),從而節(jié)省了硬件,因?yàn)闄C(jī)器要為每一個(gè)狀態(tài)準(zhǔn)備一個(gè)空間。如果我們將一個(gè) R 進(jìn)制數(shù)據(jù)的一個(gè)位上的所有的可能值設(shè)為一個(gè)狀態(tài),那么一個(gè) n 位的 R 進(jìn)制數(shù)一共需要 n*R 個(gè)狀態(tài),我們設(shè) S=n*R,現(xiàn)在我們就要求 S 的最小值,我們這個(gè)計(jì)算中僅憑這些量根本不夠,這個(gè)方程中,我們有 S 為值,而 n 和 R 為自變量,我們必須限定一個(gè)值,在這個(gè)值上比較誰的 S 更小,因?yàn)槲覀儗⒍M(jìn)制的 1000 和十進(jìn)制的 10 比較是沒有意義的,因此,我們再設(shè)一個(gè)值 M,這個(gè)值是 n 位 R 進(jìn)制數(shù)所能表示的最大值,我們就在這個(gè)值上比較,在這個(gè)最小值求解的過程中,我們可以認(rèn)為 M 是恒定的,由上述定義可以導(dǎo)出下面的等式:M=R^n(其中^為乘方),那么進(jìn)一步就有 n=logRM,帶入 S=n*R 就有 S=RlogRM,利用對數(shù)的換底公式有:S=RlnM/lnR,因此我們最終得到了一個(gè)基于自然對數(shù) e 的方程,前面說過我們可以將 M 了看做常數(shù),下面我們求 S 的極值,初看起來它并沒有單調(diào)特征,那么我們可以通過導(dǎo)數(shù)來求極值,(R/lnR)"=lnR-1,從這個(gè)導(dǎo)數(shù)可以看出,當(dāng) Re 時(shí),S">0,S 單調(diào)遞增,因此當(dāng) R=e時(shí),S 取得最小值,因此,理論上,e 進(jìn)制數(shù)對于節(jié)省狀態(tài)是最優(yōu)的,但是理論終究不是實(shí)際,自然狀態(tài)下無理數(shù)沒有什么不好,但是在涉及工程學(xué)時(shí),就更加青睞整數(shù)了,整數(shù)是離散的,適合處理,記住,不管用幾進(jìn)制數(shù),計(jì)算機(jī)處理都是基于編碼的,前面說過,編碼都是離散的,某種意義上,計(jì)算機(jī)處理就是用離散的編碼來用自己的方式重現(xiàn)連續(xù)的真實(shí)世界,計(jì)算機(jī)的最強(qiáng)大之處在處理而不是存儲(chǔ),因此它沒有必要記住整個(gè)世界,但是它需要迅速的處理這個(gè)世界,離散的方式就是計(jì)算機(jī)的方式。在 e 的兩邊有 2 和 3,我們沒有必要比較 2 和 3 下哪個(gè) S 更小,這時(shí)結(jié)果已經(jīng)很明了了,剛才是理論推算,它推算出了一個(gè) e,現(xiàn)在該讓工程學(xué)的方式給出一個(gè)具體的整數(shù)了,這時(shí)就要遵循一個(gè)原則,就是以理論為指導(dǎo),就是最終的結(jié)果不要偏離 e 太遠(yuǎn)就可以,那么只有到了這時(shí)晶體管的意義才凸顯,晶體管的特性最終采用了二進(jìn)制。
熱點(diǎn)文章閱讀