WFU

2017年1月23日 星期一

【上課筆記】Coursera 機器學習 第一週:Introduction

作者:洪聖哲醫師

吳恩達教授(Andrew Ng)在史丹佛大學教書的時候創辦了網路教育平台 Coursera,之後 2011 年他在 Google 創建了 Google Brain。2014 年加入百度,負責「百度大腦」計劃,並擔任百度公司首席科學家。

他在 Coursera 上的“機器學習”公開課,一直都是很熱門的機器學習入門課程。吳恩達老師用極其清楚直白的語言,對機器學習的幾種主要算法做了初步介紹。

這門課最大的特點,是它側重於概念理解而不是數學。數學推導過程基本被略過,重點放在讓初學者理解這背後的思路。另外課程中使用的是 Octave/MATLAB,因此不需要會Python、C語言,適合沒有編程基礎的新手。

這次也是我第一次上 Coursera 的課程,希望利用邊聽課邊做筆記的方式加深自己的印象。

------ (這是分隔線,以下是我的筆記)




1. What's machine learning?


兩種定義:

Arthur Samuel(1901 - 1990)(美國發展人工智能領域的先驅):「讓電腦能夠不需要被明確編程的情況下,可以自己學習。 」("The field of study that gives computers the ability to learn without being explicitlyprogrammed.")

Tom Mitchell(1951 - )(卡內基美隆大學教授):「如果電腦程式藉由某項經驗(E),能夠改進執行某項任務(T)時的量化指標(P),我們就稱此電腦程式能藉由經驗(E)學習執行任務(T)的表現(P)。」(" A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, as its performance at tasks in T, as measured by P, improves with experience E.")


2. Supervised learning(監督式學習)


監督式學習是指提供已經知道正確答案的資料,讓電腦找出輸入和輸出(答案)之間的關係。

監督式學習可以分成兩類問題,「迴歸(Regression)」和「分類(classification)」,兩者差別在於所要預測的目標(輸出)是連續(迴歸)和是離散(分類)。


3, Unsupervised learning(非監督式學習)


非監督式學習不提供正確答案的資料,讓電腦自行找出不同資料之間的關係。

【讀書筆記】深度學習的分類



作者:洪聖哲醫師


這篇文章的內容主要抄來網路,我只是放在這裡,方便查詢。

根據之前提到 Arend Hintze 對 AI 的分類(請參考之前文章,「機器學習?深度學習?有什麼不一樣?」),AI 專家 Carlos Perez 對深度學習也提出 AI 的五個能力等級:

1. 只能分類的系統(Classification Only,C)


該等級包含全連接神經網絡( fully connected neural network ,FCN),卷積神經網絡(convolution network,CNN)和它們之間的各種組合。這些系統輸入一個高維度向量,得到單個結果,一般是對輸入向量的分類。


2. 使用記憶分類的系統 (Classification with Memory)(CM)


這個等級包含 “C 層”網絡中整合的記憶因素。 LSTM 就是一個例子:記憶單位嵌入在 LSTM 節點中。其它類似的變形還有,神經圖靈機器(Neural Turing Machine,NMT)和 DeepMind 的可微分神經計算機(Differentiable Neural Computer,DNC)。在對行為進行計算時,這些系統會維持狀態恆定。


3. 使用知識分類的系統 (Classification with Knowledge,CK)


該等級與 CM 有些相似。但 C 層網絡能獲取的信息不是原始內存,而是符號化的知識庫(symbolic knowledge base)。事實上 Carlos Perez 就發現了三種符號化整合:1. 轉移學習方式( transfer learning approach)、2. 自上而下方式 (Top-down approach)、3. 自下而上方式(Bottom-up approach)。

第一種方式用一個符號化系統作為正則化矩陣(regularizer)。第二種方式在神經表徵底層的最上層加入了符號化元素。第三種方式跟這相反,C 層網絡直接與符號化知識庫關聯。


4. 使用有限知識的分類 (Classification with Imperfect Knowledge,CIK)


在這個級別,系統直接建立在上一個等級 CK 之上,但是,它已能夠使用不完美的信息做推理。這類系統的代表是 Alpha Go。只是 Alpha Go 採用的不是 CK 而是 CM 級別的能力。正如 Alpha Go,這類系統能通過與自身的對抗模擬來訓練自己。


5. 能使用有限知識協作分類的系統(Collaborative Classification with Imperfect Knowledge,CCIK)


這個級別和 Arend Hintze 的“心智理論”類別十分近似,多個代理神經網絡聯合起來解決問題。這些系統被設計來完成多項目標。我們其實可以在對抗網絡中運行它的原始版本:與判別器和生成網絡一起學習歸納。在博弈論驅動的、能戰略戰術性解決多重問題的網絡上應用該概念,就能得到高度靈活的系統。但是,我們現在還達不到這個水平,前面那些級別仍需要很多研究來完善。


參考資料

1. AI 初學者入門指南:深度學習的五級分類  

2017年1月16日 星期一

【讀書筆記】機器學習?深度學習?有什麼不一樣?





2016 年是人工智能蓬勃發展的一年,連專家都眼花撩亂,更不要說對我們這些門外漢來說,每次開會都像鴨子聽雷一樣。

這篇文章主要整理初一些關於人工智能(Artificial Intelligence,AI)、機器學習(Machine Learning,ML)和深度學習(Deep Learning,DL)的基本重點,還有這三者之間的差別。

2017年1月8日 星期日

【醫學相關】殭屍出沒,請小心?紐約街頭真實上演屍樂園





作者:洪聖哲醫師


2016 年 7 月 12 日,美國紐約市布魯克林區街頭大白天出現一幅駭人的景象:好幾個人躺在地上動也不動,有些人動作遲緩,對外界反應遲鈍,手腳出現機械式的舞動,眼神空洞,還不時出現殭屍般的呻吟,所以警方不得不把當地暫時封鎖,紐約時報形容為「屍樂園」(Zombieland),這一切彷彿就像電影惡靈古堡中的場景真實上演。

出現類似症狀的總人數達到 33 人,官方證實有 18 人被送到附近的兩家醫院治療。這些人送到醫院的時候,心跳、血壓、呼吸和體溫都正常,瞳孔沒有放大,沒有任何局部神經學症狀,尿液藥物篩檢也全部正常。難道這真的是惡靈古堡電影最終章的快閃宣傳