
首先考慮一個具有記憶能力的邏輯單元(也許是RNN),
它的輸出 g(t) 受到當前輸入 f(t) 與先前部份輸出 gB(t−1) 的影響。
我們可以透過一個空想實驗來理解這個過程:
- 今天我看到小明吃蘋果
"小明吃蘋果"這段資訊就是 f(0) ,但是我並不會因為這個資訊而特別做出什麼行為,僅僅只是記著。
- 隔天我又看到小明吃蘋果。
隔天看到"小明吃蘋果"這段資訊就是 f(1),而"小明昨天也吃蘋果"就是 gB(0),把這兩個資訊揉合在一起,我產生了新的概念"小明連續吃了兩天的蘋果";這就是gB(1)
- 如此一般持續過了一個月,小明幾乎天天吃蘋果。(爾偶不吃 )
究竟哪一天小明有沒有吃蘋果,我並不會清楚的記得,而是變成"小明過去一個月經常吃蘋果"這樣一個概念記在腦海中,而這個概念就是 gB(30)。
- 小明今天心情似乎很糟,而且還沒見他今天吃蘋果。
"小明心情很糟,沒吃蘋果"這個資訊就是 f(31)。
- 於是我買了蘋果送給他
"買蘋果送他"這個觸發行為的指令就是 gA(31)。
當然,這是一個簡化的空想實驗,以天為最小時序單位、一些邏輯映射關係也直接省略(如:"買蘋果送他"這個輸出似乎還應該夾帶"別人不開心我也不開心"或"小明對我而言是個特別的人"...之類的其他輸入資訊才能發生的邏輯映射。
只是為了方便讀者釐清幾個簡單的概念:
- 智能體的當前決策,來自當前認知以及先前記憶造成的邏輯映射。
- 資訊會被壓縮並丟失。
- 資訊的壓縮與丟失不只發生在認知,也發生在記憶。
- 因此智能體不會 100% 的記憶所有細節。
輸入資訊量、記憶資訊量與資訊損失之間的關係
接著我進行了幾個假設:
- 所有輸入與輸出的資訊都是二進制的數組
- 只在乎資訊的量,而不在乎內容,也就是數組的位元數
- 輸入的資訊量不隨時間改變( ∀t:F=F(t) )
於是我列出了下式:
GB(t+1)=η1F(t+1)+η2GB(t)
G:輸出的資訊量,也就是位元數
F:輸入的資訊量
η1,η2:資訊殘留率,其值小於等於1
對任意時間而言的輸出資訊量,來自於當前輸入資訊量流失;以及先前輸出的資訊流失後的加總。
於是我們可以列出:
GB(t+1)=η1F+η2GB(t)
GB(t+2)=η1F+η2η1F+η22GB(t)
GB(gt+3)=η1F+η1η2F+η1η22F+η23GB(t)
可以歸納出:
GB(t+n)=η1Fi=0∑nη2i+η2nGB(t)
若考慮在無窮的時間後,智能體被資訊塞滿的情況:
GB=n→∞limG(t+n)=1−η2η1F
資訊殘留率的測定