你是否曾經與一部似乎完全明白你在說什麼的電腦聊天?或者問過Siri或Alexa等語音助理問題並得到有用的答案?這些神奇的對話科技無處不在,從電子遊戲中的熱心角色到能夠寫故事和回答幾乎任何問題的超智能ChatGPT!但它們實際上是如何運作的呢?電腦如何能理解人類語言並像人一樣回應?
本指南將揭開這些數碼對話夥伴的神秘面紗。是時候探索人工智能(AI)和自然語言處理(NLP)的奇妙世界了──這些正是聊天機械人如此聰明的秘密武器!當聊天機械人理解一個笑話,或者語音助理僅憑一個指令就播放你最喜愛的歌曲時,這可能看起來像魔法一樣。然而,這種「魔法」背後有一套引人入勝的方法,一套由科學家和工程師們建立起來的巧妙想法和技術。本文章將揭示這些方法,說明雖然人工智能非常聰明,但它的智能來自於精心的設計和學習,而非魔法咒語!
你好,聊天機械人!你的秘密是什麼?
讓我們先來更深入地認識這些神奇的數碼朋友。
什麼是聊天機械人?你的數碼對話夥伴!
聊天機械人是專門設計來與人進行對話的特殊電腦程式。這些對話可以透過螢幕上的文字輸入,甚至可以使用語音指令進行。它們被建構成能夠理解人們所說或輸入的內容,然後以一種合乎情理的方式作出回應,幾乎就像與另一個人交談一樣。
許多人每天都在使用聊天機械人,有時甚至沒有意識到!
- ChatGPT 是一個非常著名的例子。它是一種人工智能,可以寫文章、創作詩歌、回答棘手的問題等等,所有這些都是透過理解和生成類似人類的文本來實現的。
- 語音助理,如蘋果的Siri和亞馬遜的Alexa,也是聊天機械人的一種類型。它們會聽取語音指令,可以播放音樂、告知天氣、設定計時器或回答問題。
- 在電子遊戲中,一些非玩家角色(NPC)使用聊天機械人技術與玩家進行更逼真的對話,使遊戲世界感覺更加生動。
- 在網站和應用程式上,通常會彈出一個小聊天視窗,並附帶一條友好的訊息,例如「你好!今天我能怎樣幫你?」這些通常是準備好回答常見問題或引導用戶找到所需內容的聊天機械人。
理解聊天機械人非常重要,因為它們正日益成為人們與科技互動和獲取資訊的重要組成部分。
機械人背後的「大腦」:人工智能(AI)簡介
讓聊天機械人如此聰明的主要「秘密武器」是一種叫做人工智能(Artificial Intelligence,簡稱AI)的東西。AI的核心在於讓電腦能夠執行通常需要人類智能才能完成的任務。這包括從經驗中學習、解決問題、做出決策,以及對聊天機械人而言至關重要的──理解語言的能力。
可以這樣想:如果聊天機械人是一家餐廳裡友好的侍應,他會接受點餐並送上食物,那麼AI就像廚房裡超級聰明的總廚,他負責想出所有食譜並指導所有菜式的製作。AI是驅動聊天機械人能力的「大腦」。
值得注意的是,AI不僅僅存在於聊天機械人中;它已經在日常生活的許多方面默默運作。例如,將垃圾郵件過濾掉的垃圾郵件過濾器使用AI來判斷哪些郵件是垃圾郵件。在輸入短訊或電子郵件時建議下一個詞語的自動完成功能也使用AI來預測一個人可能輸入的內容。 所以,AI並非遙不可及的未來概念;它是許多人每天都在使用並從中受益的技術,而聊天機械人的世界只是AI在實際應用中的一個令人興奮的例子。
它們是如何像我們一樣「說話」的?快速一瞥!
那麼,這些由AI驅動的聊天機械人是如何如此出色地理解和使用人類語言的呢?它們使用AI的一個特殊領域,稱為自然語言處理(NLP)。NLP致力於教導電腦處理和理解人類所說和所寫的語言,例如英語、西班牙語或中文。
聊天機械人,尤其是像ChatGPT這樣的先進聊天機械人,透過研究大量的文本和對話來學習如何「說話」。想像一下,一部電腦閱讀了幾乎所有曾經寫過的書、互聯網上的每個網站以及數百萬次人們的對話!透過分析所有這些數據,AI學習了人類溝通的模式、語法和細微差別。 這個大規模的學習過程使它們能夠理解問題並生成聽起來驚人地像人類的回應。AI學習語言的過程非常引人入勝,本文章稍後將更深入地探討。
喂 Siri,你怎麼能聽懂我說話?語音助理大揭秘!
像Siri和Alexa這樣的語音助理是最常見的AI夥伴之一。它們存在於手機、智能揚聲器甚至汽車中。但是,它們是如何從聽到聲音到給出語音答案的呢?這是一個超快的多步驟過程!這些裝置看似無縫理解和回應的方式,可能讓這項技術看起來幾乎像魔法一樣。然而,這種流暢的互動實際上是一系列不同技術在一條鏈中協同工作的快速序列的結果。理解這條鏈不僅揭示了簡單介面背後的複雜性,還有助於欣賞所涉及的工程技術,並解釋了為什麼有時會在不同階段發生錯誤。
第一步:超級聽力!(自動語音識別 – ASR)
首先,語音助理需要「醒來」並開始聆聽。這通常發生在它聽到一個特殊的「喚醒詞」或短語時,例如「喂 Siri」、「Alexa」或「OK Google」。一旦醒來,它就會使用一種稱為自動語音識別(ASR)的技術。ASR是其「大腦」中專注於將口語單詞轉換為電腦可以理解的書面文本的部分。
想像ASR是一個超快、隱形的打字員。當一個人說話時,這位打字員會專心聆聽,並在瞬間打出每一個字。這個打字版本就是AI系統其餘部分將要處理的內容。
第二步:從語音到螢幕上的文字 (語音轉文字)
ASR將口語單詞轉換為數碼文本的過程通常稱為語音轉文字。 這項技術至關重要,因為電腦無法像處理文本那樣直接理解聲波。
為了使語音轉文字功能良好運作,清晰地說話非常有幫助。如果有人含糊不清,或者背景噪音很大,ASR「打字員」可能會弄錯一些單詞,就像一個人在嘈雜的房間裡可能會聽錯一樣。 這是與AI互動時一個基本但重要的原則:輸入的質量(提供給AI的內容)直接影響輸出的質量(AI產生的內容)。如果AI收到的指令不清晰或令人困惑,無論是口頭的還是書面的,它都很難給出正確的回應。
語音轉文字技術不僅僅用於語音助理。它還用於聽寫軟件,允許人們透過說話而不是打字來撰寫文件或電子郵件。 這對於那些覺得打字困難或想更快寫作的人來說是一個很大的幫助。
第三步:腦力激盪 ── 理解你的意思!(自然語言處理 – NLP)
一旦ASR將口語指令轉換為文本,語音助理的AI大腦就需要理解該文本的含義。這就是自然語言處理(NLP)再次發揮作用的地方。 如前所述,NLP是幫助電腦理解人類語言的技術。
對於語音助理,NLP會分析指令的文本以弄清楚語法、識別關鍵詞,最重要的是,理解用戶的目標或意圖。例如,如果文本顯示「今天天氣怎麼樣?」,NLP會幫助AI理解此人想要當天的天氣報告。 這就像AI試圖讀懂字裡行間的意思以獲取真正的含義。
第四步:尋找答案 (知識庫和API)
在NLP弄清楚用戶想要什麼之後,語音助理需要找到實際的資訊或執行所請求的操作。它透過搜索自己的「知識庫」(存儲在其記憶體中的大量資訊集合)或透過稱為API(應用程式介面)的東西連接到互聯網上的其他服務來實現這一點。 API就像特殊的信使,允許不同的電腦程式相互交談和共享資訊。
例如,如果被問及當前天氣,語音助理將使用API聯繫天氣服務提供商,獲取最新的天氣預報,然後準備好將該資訊傳回給用戶。 語音助理執行的許多更複雜的任務,例如從串流媒體服務播放特定歌曲或控制智能家居裝置,都依賴於這些互聯網連接和API來存取存儲在「雲端」(可透過互聯網存取的強大電腦和存儲)中的資訊和服務。
第五步:回話給你!(文字轉語音 – TTS)
最後一步是語音助理以語音將答案傳回給用戶。一旦AI找到答案(通常是文本形式),它就會使用另一種巧妙的技術,稱為文字轉語音(TTS)。 TTS的作用與ASR相反:它接收數碼文本並將其轉換為可聽的語音,使用電腦生成的聲音。
將TTS想像成電腦大聲朗讀劇本。多年來,這些聲音變得非常自然,讓人感覺更像是一次真正的對話。與語音轉文字一樣,TTS技術也用於其他有用的方面,例如螢幕閱讀器軟件,它可以為有視覺障礙或閱讀困難的人大聲朗讀螢幕上的文本。
一瞬間完成!
最令人驚奇的部分是,這整個五個步驟的過程──從一個人說話,到ASR,然後是NLP,再到尋找答案,最後是TTS回話──通常只需要一兩秒鐘! 這是一個令人難以置信的快速而複雜的過程。由於涉及如此多的步驟,而且人類語言可能很棘手,語音助理並不總能完全正確。有時它們可能會聽錯一個詞或誤解一個請求,考慮到所有事情都必須如此迅速地發生,這是可以理解的。
語音助理的普遍性使其成為介紹一些更抽象的AI概念的絕佳且易於理解的方式,這些概念對於理解所有聊天機械人的工作原理至關重要。透過了解NLP如何應用於他們可能每天使用的裝置中,人們更容易掌握其在其他AI應用程式(如基於文本的聊天機械人)中的重要性。
教AI說話:超高速語言課!
既然已經清楚語音助理如何處理指令,現在是時候更深入地研究「腦力」本身了:自然語言處理(NLP)。這是讓從Siri到ChatGPT等各種AI能夠理解和使用人類語言的核心技術。
秘密代碼:什麼是自然語言處理(NLP)?
概括而言,自然語言處理(NLP)是指專注於幫助電腦理解、解釋和生成人類語言(無論是口頭的還是書面的)的技術。 NLP的最終目標是使人類能夠以自然、日常的方式與電腦交流,而無需為簡單的互動學習複雜的電腦程式語言。 將NLP想像成一個複雜的解碼環,幫助電腦解鎖隱藏在我們詞語和句子中的模式和含義。
這裡需要澄清一點。如果有人搜索「兒童NLP」,他們可能會遇到稱為「神經語言程式學」的東西。另一種NLP是一個與心理學相關的領域,探索心靈、語言和人類行為之間的聯繫,通常用於治療或輔導。 這不是在AI和聊天機械人背景下討論的NLP。這裡的重點嚴格放在NLP的人工智能版本上,它涉及電腦如何處理人類語言。
電腦如何「閱讀」:分解句子 (數據預處理)
在AI甚至開始理解句子含義之前,原始的人類語言需要被清理和組織成電腦演算法可以處理的格式。這個關鍵的第一階段稱為數據預處理。 這就像廚師在開始烹飪一頓飯之前精心準備所有食材一樣。如果食材準備不當,最終的菜餚就不會好吃。同樣,如果語言數據沒有得到有效的預處理,AI將很難理解它。
以下是一些常見的預處理步驟:
- 斷詞 (Tokenization):切分詞語! 第一步通常是斷詞。這包括將一段文本分解成更小的單位,稱為「標記」(token)。這些標記通常是單個詞語,但也可以是詞語的一部分或標點符號。
- 例如,句子「The quick brown fox.」將被斷詞為:「The」、「quick」、「brown」、「fox」、「.」。
- 停用詞移除 (Stop Word Removal):忽略常用詞! 許多語言中都有一些極其常見但本身通常不帶有很多特定含義的詞語,例如「the」、「is」、「a」、「an」、「on」、「at」。這些被稱為停用詞。在某些NLP任務中,這些停用詞會從斷詞後的文本中移除。 這有助於AI專注於傳達句子核心含義的更重要的詞語。
- 例如,從「the cat sat on the mat」中移除停用詞後,可能會剩下:「cat」、「sat」、「mat」。
- 詞形還原 (Lemmatization) 和詞幹提取 (Stemming):尋找詞根! 詞語可以以許多不同的形式出現(例如,「run」、「running」、「ran」、「runs」都與相同的基本動作相關)。詞幹提取和詞形還原是用於將詞語的這些不同形式簡化為共同的基本或詞根形式的技術。
- 詞幹提取是一個更簡單的過程,通常只是去掉詞語的末尾。例如,「running」、「runner」和「runs」都可能被提取詞幹為「run」。它速度快,但有時可能會產生非字典詞語。
- 詞形還原是一個更複雜的過程。它使用詞彙和語法分析來返回詞語的基本或字典形式,稱為「詞元」(lemma)。例如,「ran」將被詞形還原為「run」,而「better」將被詞形還原為「good」。詞形還原通常比詞幹提取更準確,但速度可能較慢。
- 詞性標註 (Part-of-Speech Tagging):標記詞語的工作! 另一個重要的預處理步驟是詞性標註(POS Tagging)。這包括為句子中的每個標記(詞語)分配一個語法類別──例如名詞、動詞、形容詞、副詞、代名詞等。
- 例如:「The (限定詞) cat (名詞) quickly (副詞) chased (動詞) the (限定詞) mouse (名詞)。」詞性標註有助於電腦理解句子的語法結構以及不同詞語所扮演的角色,這對於更深層次的意義提取至關重要。
這些預處理步驟將混亂、非結構化的人類語言轉換為更結構化和易於管理的格式,為AI執行更複雜的分析鋪平了道路。
理解含義:句法和語義
一旦文本經過預處理,AI就會使用NLP技術來分析其結構和含義。這裡的兩個關鍵概念是句法和語義。
- 句法 (Syntax):句子建構的規則! 句法是指語言的語法結構──規定詞語必須如何排列以形成有效且有意義的句子的規則。 這就像用樂高積木搭建的說明手冊;積木塊需要以特定的方式連接,結構才能保持完整並具有意義。NLP使用句法分析來解析句子、識別短語,並根據詞序和語法角色理解詞語之間的關係。
- 語義 (Semantics):詞語的實際含義是什麼? 雖然句法處理結構,但語義則關乎詞語、短語和句子在其特定上下文中的含義。 人類語言充滿了具有多種含義(歧義)和細微差別的詞語。語義分析試圖破譯這種含義。
- 例如,「bat」這個詞可以指飛行的哺乳動物,也可以指體育器材。語義分析使用諸如詞義消歧 (Word Sense Disambiguation) 之類的技術,試圖根據周圍的詞語和整體上下文來確定正確的含義。
- 另一個重要的語義任務是命名實體識別 (Named Entity Recognition, NER)。這包括識別和分類文本中的關鍵實體,例如人名、組織機構名稱、地點、日期和數量。 例如,NER可以區分電子商務公司「Amazon」和河流「Amazon」。
猜測你的目標:意圖識別
當一個人與聊天機械人互動時,他們通常心中有一個特定的目標或目的。意圖識別是NLP的一項任務,AI試圖弄清楚用戶希望透過他們的訊息達到什麼目的。 這就像聊天機械人問自己:「這個人要求我做的主要工作是什麼?」或「這句話的潛在目的是什麼?」
例如:
- 如果用戶輸入「今天倫敦天氣怎麼樣?」,AI會將意圖識別為「獲取天氣資訊」。
- 如果用戶說「預訂一張晚上7點兩人桌」,意圖就是「進行預訂」。理解用戶的意圖至關重要,因為它允許聊天機械人提供正確類型的回應或採取適當的行動。 如果沒有它,聊天機械人可能只會給出隨機的資訊,而不是滿足用戶的實際需求。
尋找關鍵詞:實體識別
意圖識別確定了整體目標,而實體識別(通常是命名實體識別的一部分,但範圍可以更廣)則專注於從用戶的訊息中提取重要的特定資訊──實體。 這些實體是聊天機械人準確完成已識別意圖所需的關鍵細節。
繼續天氣的例子:
- 用戶訊息:「明天倫敦天氣怎麼樣?」
- 意圖:獲取天氣資訊。
- 實體:「倫敦」(識別為地點)和「明天」(識別為時間/日期)。 將實體識別想像成聊天機械人使用一支神奇的螢光筆標記句子中所有關鍵的詞語和細節。這些實體為聊天機械人的行動提供了具體的參數。如果聊天機械人只理解意圖(「獲取天氣」)卻沒有識別出實體(「倫敦」、「明天」),它就不知道要報告哪個城市的天氣或哪一天的天氣。
理解語言的過程可以被認為是建造像三文治一樣複雜的東西。數據預處理就像準備所有食材──清洗生菜、切番茄和芝士,以及準備麵包。分析句法和語義就像理解這些食材如何組合在一起形成適當的三文治結構並味道鮮美。最後,意圖和實體識別就像弄清楚顧客到底點了什麼樣的三文治──一份火雞公司三文治加額外蛋黃醬,不要洋蔥!這個「NLP三文治」的每一層對於聊天機械人提供令人滿意和準確的回應都至關重要。
以下是一些NLP偵探工具的快速摘要:
NLP偵探工具 |
它的作用(兒童語言!) |
斷詞 (Tokenization) |
將句子切成詞語大小的片段! |
停用詞移除 |
「忽略非常常見的詞語(例如「的」、「一個」)以專注於重要的詞語!」 |
詞形還原 |
「找到詞語的字典詞根(例如「跑了」變成「跑」)。」 |
詞性標註 |
「標記每個詞語的工作(名詞、動詞、形容詞等)。」 |
句法分析 |
檢查句子語法是否建構正確。 |
語義分析 |
弄清楚詞語和句子的實際含義。 |
意圖識別 |
猜測主要目標或一個人希望AI做什麼。 |
實體識別 |
「發現並突顯重要的關鍵詞(例如姓名、地點、時間)。」 |
AI如何學習語言:從海量文本中學習!
NLP系統構建以理解語言的方法通常有兩種主要途徑:
- 基於規則的系統: 在NLP的早期,系統通常是基於規則的。這意味著人類程式設計師必須煞費苦心地為電腦編寫大量明確的語法規則和詞彙列表以供其遵循。 想像一下給AI一本關於每種可能的句子結構和詞義的巨大且極其詳細的規則手冊。雖然這對於非常具體和有限的任務可能有效,但它很快變得過於複雜和脆弱,無法處理真實人類語言的巨大多樣性和細微差別。
- 基於機器學習的系統: 現代NLP嚴重依賴基於機器學習的系統。這些AI系統不是被提供明確的規則,而是直接從大量的文本和語音數據中學習模式和關係。 這種方法更加靈活和強大,因為AI可以學習人類無法詳盡定義的微妙模式。這些系統的性能通常會隨著接觸更多數據而提高。從基於規則的NLP轉向基於機器學習的NLP是一個改變遊戲規則的轉變,這在很大程度上得益於海量數據集(如整個互聯網)的日益普及以及能夠處理這一切的更強大電腦的出現。這種「數據越多,AI通常越好」的原則是現代AI(如ChatGPT)如此強大的根本原因;它有效地「看見」並從前所未有的大量人類語言中學習。
像ChatGPT這樣的人工智能模型是在通常被描述為「海量數據」的基礎上進行訓練的──字面上是來自書籍、文章、網站和對話的數十億個單詞和句子。 人工智能並不像人類那樣「理解」這些文本,即理解意義、思想和情感。相反,透過複雜的演算法(通常是受人腦結構啟發的神經網絡),它在識別統計模式和預測在任何給定上下文中接下來最可能出現哪個單詞或單詞序列方面變得非常出色。 這就像成為一個超級複雜的自動完成大師,總是根據它所讀過的一切來猜測一個句子最可能的延續。
一些AI研究甚至探索以更像人類兒童學習的方式學習語言。例如,一個名為CVCL(兒童視角對比學習)的AI系統是透過「觀看」一個幼兒頭上佩戴的攝像機在一年多的時間裡錄製的影片進行訓練的。這個AI學會了將「球」或「蝴蝶」等詞語與它在影片中「看到」的這些物體的圖像聯繫起來,並伴隨著這些詞語被說出的聲音。 這種AI同時從多種類型的數據(如圖像和音頻)中學習的方法稱為多模態學習。
雖然「AI像孩子一樣學習」這個比喻很吸引人,有助於說明從範例中學習的想法,但理解其局限性非常重要。人類兒童透過豐富的社交互動、情感聯繫、在世界中的身體體驗,以及天生的推理和概括能力來學習語言,所有這些都來自於與AI模型所輸入的數據量相比相對較少的數據。 目前的AI,尤其是主要基於文本訓練的大型語言模型,是透過識別文本中的統計規律來學習的。它缺乏兒童所發展出來的具體經驗、常識推理和真正的理解。因此,雖然這個比喻是一個有用的起點,但AI學習的方式和它所「理解」的內容與人類認知有著根本的不同。
聊天機械人越來越聰明:從對話中學習
許多AI聊天機械人被設計成即使在初始訓練後也能繼續學習和改進。它們可以從與用戶的持續互動中學習。 當一個人與聊天機械人交談時,AI可以分析所說的內容、它的回應方式,甚至可能分析用戶是否對答案感到滿意。這種反饋有助於AI完善其理解並在將來產生更好的回應。一些先進的聊天機械人甚至可以記住當前對話的先前部分,從而實現更自然和連貫的對話,而不是將每條訊息都視為一個全新的、孤立的查詢。 這種學習和適應能力使聊天機械人隨著時間的推移變得越來越複雜和有用。
一起動手做個聊天機械人吧!輪到你當AI訓練師了(用Scratch!)
閱讀關於AI聊天機械人如何運作很有趣,但如果能親手製作一個呢?有了專為年輕學習者設計的工具,就有可能獲得實踐經驗並成為一名AI訓練師!本節將探討如何使用Scratch(一個受兒童歡迎的編程平台)以及一些特殊的AI擴展功能來創建一個簡單的聊天機械人。即使是構建和訓練一個基本的AI模型的經驗,也能將一個人從對「神奇」技術的被動使用者轉變為一個主動的創造者,掌握自己的輸入如何塑造AI的行為。
什麼是Scratch?你的超棒編程遊樂場!
Scratch 是麻省理工學院開發的一款出色的視覺化程式語言,專為年輕人設計。 用戶不是輸入複雜的程式碼,而是透過拼接彩色的積木塊來創建程式,就像玩樂高積木一樣。這種拖放介面使初學者可以輕鬆創建自己的互動故事、遊戲和動畫,而無需任何先前的程式設計知識。 這是一個富有創意和樂趣的環境,可以學習編程和計算思維的基礎知識。
Scratch的AI超能力:特殊擴展功能!
要將AI功能引入Scratch專案中,可以使用特殊的擴展功能。這些是為Scratch提供新積木塊和新功能的附加元件。 以下是一些非常適合探索AI的擴展功能:
- Machine Learning for Kids擴展功能: 這個由IBM開發的擴展功能將Scratch連接到一個免費的線上工具,學生可以在其中訓練自己的機器學習模型來識別文本、圖像、數字或聲音。 在訓練模型之後(例如,教它區分詢問關於貓的句子和詢問關於狗的句子),學生就可以在他們的Scratch專案中使用該模型來構建諸如簡單聊天機械人或圖像分類器之類的東西(就像某個資源中提到的「垃圾分類智慧王:AI垃圾分類員」專案一樣,AI學會對可回收物品進行分類)。
- Teachable Machine (由Google提供) 與Scratch結合: Teachable Machine是Google提供的另一個非常易於使用的網頁工具,任何人都可以訓練一個簡單的AI模型來識別圖像、聲音或姿勢(身體位置),而無需編寫任何程式碼。 用戶只需透過網路攝影機或麥克風提供範例即可訓練模型──例如,向其展示笑臉與哭臉的圖片,或做出不同的手勢。模型訓練完成後,可以匯出並使用特殊的擴展功能輕鬆整合到Scratch專案中。 這使得可以創建有趣的專案,例如模仿面部表情的Scratch角色,或用手勢而不是鍵盤控制的遊戲。
- 臉部偵測積木 (在Scratch實驗室中): Scratch實驗室是Scratch團隊分享實驗性新功能的地方。其中之一是臉部偵測積木,它允許Scratch專案透過網路攝影機即時偵測並對人臉做出反應。 這些積木背後的AI已經接受了數百萬張臉部照片的訓練,因此它可以識別臉部的存在並定位鼻子、眼睛和嘴巴等特徵。 它可以判斷是否有臉部存在,但無法識別此人是誰,這有利於保護私隱。學生可以使用這些積木讓一個精靈(Scratch中的角色)跟隨他們的鼻子在螢幕上移動,或者在他們的頭上放置虛擬的帽子和眼鏡。 這些積木是觀察預測性AI實際運作的好方法,因為AI會根據它學到的模式預測臉部特徵的位置。
這些不同的工具適用於探索AI的不同方面。例如,如果目標是看到AI即時對臉部做出反應,那麼臉部偵測積木就非常完美。要快速教會AI區分不同的圖像(如貓與狗)或聲音,Teachable Machine因其簡單性而成為絕佳選擇。對於需要理解不同類別用戶輸入的基於文本的聊天機械人,Machine Learning for Kids擴展功能是一個非常好的起點。
你的第一個AI聊天機械人專案:「讚美機械人」
讓我們逐步了解如何使用Scratch和Machine Learning for Kids擴展功能創建一個非常簡單的聊天機械人。這個名為「讚美機械人」的機械人將被訓練成在識別到問候或詢問其健康狀況時給予友好的讚美。
這種訓練、測試和可能重新訓練AI模型的實踐過程,讓學生能夠直接體驗AI的「學習」能力及其固有的局限性。他們可以看到AI並非「無所不知」,而是完全依賴於所提供訓練數據的質量和數量。如果機械人犯了錯誤,通常是因為訓練數據不足或不清晰,這本身就是一個深刻的教訓。
以下是大致步驟,總結在下面的便捷表格中:
表格:你的第一個Scratch聊天機械人:快速步驟
步驟 |
行動 |
1 |
「規劃你的機械人! 決定你的機械人會說些什麼簡單的話。對於『讚美機械人』,它會回應問候和『你好嗎?』。」 |
2 |
「前往Machine Learning for Kids並建立專案。 造訪該網站,開始一個新專案,並選擇『文本』作為它將識別的事物類型。」 |
3 |
「新增標籤(你的聊天類別)。 為用戶可能說的內容類型建立類別。例如,一個名為『問候』的標籤和另一個名為『健康詢問』的標籤。」 |
4 |
「新增範例(用戶輸入的內容)。 對於每個標籤,輸入至少5-10個用戶可能說的不同範例。對於『問候』:『Hi』、『Hello』、『Hey』。對於『健康詢問』:『你好嗎?』、『最近怎麼樣?』」 |
5 |
「訓練模型! 點擊『學習與測試』按鈕,然後點擊『訓練新的機器學習模型』。AI將從範例中學習。」 |
6 |
「前往Scratch。 訓練完成後,在Machine Learning for Kids中點擊『製作』,然後選擇Scratch 3。這將打開一個帶有已訓練模型的新積木塊的Scratch專案。」 |
7 |
「編寫聊天程式! 在Scratch中,使用諸如 詢問 [你想說什麼?] 並等待 之類的積木塊。然後,使用特殊的AI積木塊 識別文本 (回答) 的標籤 來獲取AI的猜測。使用 如果 <(文本輸入標籤) = [問候]> 那麼 積木塊,讓機械人根據識別到的標籤說出 [你好,你真棒!] 或 [我感覺棒極了,謝謝你的關心!]。如果信心度低或標籤未知,則新增預設回應。」 |
8 |
「測試與重新訓練! 點擊綠色旗幟並與機械人聊天!如果它犯了錯誤,返回Machine Learning for Kids,為標籤新增更多範例,然後重新訓練模型。」 |
這個簡單的專案展示了機器學習的核心循環:提供數據、訓練模型、測試模型和改進模型。
更多專案點子!
一旦「讚美機械人」運作正常,學生們可以嘗試更具雄心的專案。某個資源中提到的「旅遊機械人歷險記」可以是一個分享不同國家有趣事實的聊天機械人。 或者,使用Teachable Machine與Scratch結合,他們可以創建一個「情緒偵測器」,讓角色根據用戶的臉部表情改變表情,或者一個由自訂手勢控制的遊戲。可能性非常廣闊,關鍵是從簡單開始,隨著理解的加深而逐步增加複雜性。
聰明對話:關於AI聊天機械人的重要事項
AI聊天機械人是很棒的工具,但就像任何技術一樣,正確理解並明智地使用它們非常重要。它們可以非常有用和有趣,但它們不是人類,有一些關鍵事項需要牢記。
聊天機械人有感情嗎?天大的問題!
聊天機械人可以被編程得聽起來非常友好、善解人意,甚至富有同情心。它們可能會講笑話、說些鼓勵的話,或者使用暗示情感的表情符號。 這種像人一樣的互動可以讓它們非常吸引人。
然而,至關重要的是要理解AI聊天機械人沒有像人類一樣的真實感受或情感。 它們在識別語言模式方面非常複雜。它們從無數的人類對話中學會了人們如何透過語言表達情感,因此它們可以非常有效地模仿這些表達。
一個比喻可以是教會說「我愛你」的鸚鵡。鸚鵡可以完美地說出這些詞,但它實際上並沒有感受到愛的的情感。聊天機械人在表達情感方面與此類似;它是基於模式生成回應,而不是真正的感受。AI聊天機械人設計得越「像人」,它就越能有效地溝通和提供協助。然而,這種極度的人性化也帶來了風險:它可能導致用戶,尤其是年輕用戶,將AI誤認為是真實的、有感情的實體,從而可能形成不健康的依戀或被其表面的理解所誤導。 這是一種弔詭,即旨在提高參與度的良好設計,卻可能無意中導致對AI基本性質的誤解。
AI不像你一樣「思考」或「理解」
雖然AI可以極快地處理資訊並執行複雜的任務,但它不像人類那樣「思考」或「理解」。 AI透過遵循演算法(即一組編程指令)或使用從數據中學習到的模式來運作。它不具備意識、自我意識、個人觀點,也沒有人類用來理解世界的豐富現實經驗。
像「黑箱」或「冰山」這樣的比喻在這裡可能有所幫助。 我們可以看到AI的輸出(聊天回應),就像冰山露出水面的尖端一樣。但在表面之下,存在著我們看不到的巨大而複雜的過程和數據。這些過程基於數學計算和統計相關性,而不是基於類似人類的思考或真正的理解。AI聊天機械人更像是一個處理文字而不是數字的超級先進計算器。
聊天機械人會出錯或帶有偏見嗎?會的!
非常重要的一點是,AI聊天機械人並非總是正確的。
- 資訊準確性: 由於聊天機械人是根據它們從大量數據(其中大部分來自互聯網)中學到的模式生成文本,它們有時可能會提供不正確、過時甚至完全捏造的資訊。這些捏造的回應有時被稱為「幻覺」。 它們不像人類那樣「知道」事實;它們是在預測接下來應該出現哪些詞語以形成聽起來合理的答案。即使是更簡單的語音助理也並非總是準確的。 一個資料來源指出,「聊天機械人嚴重依賴其訓練數據,這些數據可能包含偏見、過時資訊或完全錯誤的內容」。
- AI中的偏見: 如果AI學習的數據包含不公平的偏見(例如,對某些人群的刻板印象),AI可能會無意中學習並在其自身的回應中重複這些偏見。
這就是為什麼在與AI聊天機械人互動時,批判性思維絕對至關重要。始終仔細思考聊天機械人提供的資訊。如果是重要的事情,最好與可信賴的成年人(如父母或老師)核實該資訊,或在可靠的來源(如百科全書或信譽良好的網站)中查找。 對抗這些AI局限性的最有效方法是培養強大的批判性思維能力。這意味著鼓勵質疑、驗證,而不是被動地接受AI生成的內容為絕對真理。AI應被視為輔助思考的工具,而不是取代思考。
安全聰明地聊天
雖然聊天機械人可能很有趣和有用,但安全是關鍵:
- 私隱: 要非常小心與聊天機械人分享個人資訊,例如全名、地址、電話號碼、密碼或私人家庭詳細資料。 通常不清楚這些數據將如何被儲存或使用。
- 情感依戀: 由於聊天機械人可以被設計得非常吸引人和健談,因此很容易開始感覺聊天機械人是一個真正的朋友,特別是對於那些鼓勵用戶將其視為虛擬伴侶的應用程式而言。 重要的是要記住,它們不是真正的朋友,無法提供人際關係所能提供的真正支持、同情和理解。 花太多時間與AI伴侶相處也可能導致與真正的朋友和家人相處的時間減少,這對社交發展很重要。
- 不當內容: 儘管開發人員試圖內建過濾器,但聊天機械人有時可能會生成不適合兒童的回應。它們可能會說一些令人困惑的話,給出奇怪的建議,或者在某些報告的案例中,甚至要求不當資訊或進行不適當的角色扮演。
- 與可信賴的成年人交談: 如果聊天機械人說了任何讓人感到奇怪、困惑、害怕或不舒服的話,立即停止互動並告訴父母、老師或其他可信賴的成年人非常重要。
未來充滿對話!接下來呢?
人工智能是一個飛速發展的領域。人工智能系統不斷學習,在理解和生成人類語言方面越來越好,甚至在從不同類型的輸入(如影片和語氣)中學習方面也是如此。 我們很可能會看到人工智能和聊天機械人出現在我們生活的更多方面,以新的、令人興奮的方式幫助我們。
現在學習人工智能如何運作是一個很好的第一步。它有助於每個人成為這項技術更聰明、更安全的使用者。誰知道呢?也許一些正在閱讀這篇文章的年輕人會受到啟發,成為下一代人工智能的創造者,為未來打造更出色、更負責任的人工智能工具!雖然大部分焦點集中在個人如何使用人工智能上,但對於年齡較大的學生來說,值得注意的是,創造「良好」和「安全」的人工智能不僅僅涉及巧妙的編程。它需要深思熟慮的設計、對道德問題的仔細考量,以及開發者甚至立法者為確保人工智能有益和公平而持續努力。 對人工智能生態系統的這種更廣泛的理解突顯了引導這項強大技術是一項共同的責任。
聊天機械人創造者詞彙表和有趣事實!
這次進入聊天機械人和AI世界的旅程介紹了一些新詞彙和酷炫的想法。以下是一些關鍵術語的快速解碼器,外加一些有趣的事實,以激發更多的好奇心!
你的AI詞彙解碼器!
AI詞彙 |
它的含義(兒童版!) |
AI (人工智能) |
「教電腦做聰明的事情,例如學習、解決問題和理解。」 |
NLP (自然語言處理) |
「幫助電腦理解和使用人類語言(例如英語、西班牙語等!)。」 |
演算法 (Algorithm) |
電腦執行任務時遵循的一系列逐步指令或規則。 |
ASR (自動語音識別) |
「將口語轉換為螢幕上文字的技術。」 |
TTS (文字轉語音) |
「將螢幕上的文字轉換為口語的技術,就像電腦朗讀一樣。」 |
聊天機械人 (Chatbot) |
一個設計用來與人交談的電腦程式。 |
意圖 (Intent) |
「一個人希望聊天機械人做什麼,或者他們訊息的主要目標。」 |
實體 (Entity) |
「訊息中的重要關鍵詞或細節(例如姓名、地點、時間或事物)。」 |
斷詞 (Tokenization) |
「將句子切成更小的片段,通常是詞語。」 |
句法 (Syntax) |
「詞語排列以構成正確句子的語法規則。」 |
語義 (Semantics) |
「對話中詞語和句子的實際含義。」 |
機器學習 (Machine Learning) |
「一種讓電腦從大量數據中學習而無需為每個細節編程的方法。」 |
訓練數據 (Training Data) |
「用於『教導』AI模型的資訊(例如文本、圖像或聲音)。」 |
Scratch |
「一個有趣的免費網站,孩子們可以在上面使用彩色積木塊編寫自己的遊戲和故事。」 |
你知道嗎?酷炫的AI事實!
- 一些AI非常先進,可以僅憑文字描述就寫詩、作曲,甚至創作令人驚嘆的藝術品!
- 第一個能夠進行簡單對話的電腦程式(一種非常早期的聊天機械人)早在1960年代就被創造出來了!她的名字叫ELIZA,她假裝是一名治療師。
- AI在理解人類語言中最棘手的事情之一是諷刺和幽默。電腦非常合乎邏輯,而諷刺通常意味著與字面意思相反! 科學家們正在努力教AI這些更微妙的人類說話方式。
- AI正被用於幫助科學家做出新的發現,從尋找新藥物到更多地了解我們的星球和宇宙!
結論:理解AI的冒險之旅
探索聊天機械人如何溝通,帶領我們踏上了一段進入人工智能和自然語言處理核心的激動人心的旅程。我們已經看到,這些「數碼對話夥伴」並非由魔法驅動,而是由極其聰明的科學和工程技術驅動。
像Siri和Alexa這樣的語音助理執行著一個快速、多步驟的技術之舞:自動語音識別(ASR)將口語轉換為文本,自然語言處理(NLP)理解這些詞語背後的含義和意圖,搜索龐大的知識庫或互聯網以尋找答案,最後,文字轉語音(TTS)以熟悉的聲音傳遞回應。每一步都是AI協同工作的壯舉。
它們理解的核心是NLP,它涉及複雜的過程,如將句子斷詞、分析句法(語法)和語義(含義),以及識別用戶意圖和關鍵實體。AI學習語言並非透過被給予一本字典,而是透過處理大量的文本和對話,使其能夠檢測模式並預測人類如何溝通。雖然「像孩子一樣學習」這樣的比喻可以讓我們一窺端倪,但AI的學習從根本上是不同的,它基於統計模式而不是真正的人類理解。
也許最令人興奮的是,現在年輕的學習者也可以使用實驗AI的工具。像Scratch這樣的平台,結合Machine Learning for Kids或Teachable Machine等擴展功能,使學生能夠從僅僅是AI的使用者轉變為創造者和訓練者。建立一個簡單的聊天機械人可以提供寶貴的實踐經驗,了解AI模型是如何訓練的,它們如何從數據中「學習」,以及它們的性能如何直接取決於該訓練。
然而,隨著AI越來越多地融入我們的生活,以意識和批判性思維來對待它至關重要。聊天機械人和AI系統不具備情感或意識;它們看似富有情感或智能的回應是複雜模式匹配的結果。它們可能非常有用,但也可能提供不正確或帶有偏見的資訊。因此,培養批判性思維能力和實踐安全的網路習慣──例如保護個人資訊以及就任何令人不安的網路體驗與可信賴的成年人交談──比以往任何時候都更加重要。
AI的世界在不斷發展,其理解和生成語言的能力只會不斷提高。透過現在學習這些技術,年輕人不僅僅是在滿足他們的好奇心;他們正在裝備自己,以知識成為知情的公民,甚至可能成為以負責任和有益的方式塑造AI未來的創新者。理解AI的冒險才剛剛開始!