AI學人，人也在學AI

打開任何一個社群平台，越來越多的貼文讀起來都有一種奇特的熟悉感。用詞精準、語氣平和、段落工整，好像一個永遠不會累的萬事通，想到就來上一篇。這當然不是巧合，我們都知道其中有AI的輔助，但也沒什麼不好的，畢竟最後還是人決定要不要按下發布鍵，文章的觀點和審美觀由作者自負。

不過現在有研究者開始擔心，原本應該是AI學我們寫作，但實際上是我們正在不自覺的學AI寫作，而這會有很大的缺陷，因為雖然AI讀了很多書，但基本上沒聽過人話（單純的語音辨識除外）。

一般人可能以為LLM是靠「閱讀人類的語言」建立起來的，應該相當貼近真實的人類溝通方式。但哈佛大學Berkman Klein中心的研究員及資安專家Bruce Schneier與芝加哥大學歷史學家Ada Palmer最近在衛報發表的評論直接點破了這個假設，事實上，這些大語言模型的訓練語料幾乎全部來自書面文字，網頁、書籍、社群貼文、電影劇本，卻嚴重缺乏人類最日常、最核心的溝通形式：面對面的口語對話。

他們主張，非正式口語（unscripted speech）才是人類語言的大宗，而那正是AI學不到的東西。也就是說，AI從一開始就只能用人類「最正式、最修飾、有時也是最糟糕的形式」來認識（學習？）我們，這不是人類的真實溝通全貌。

而且這個先天性缺陷正在產生一個意想不到的反向效果，有人稱為滲透效應，白話說就是人類開始在模仿AI了。

德國馬克斯普朗克研究所的研究分析了ChatGPT推出前後的YouTube影片，發現一些原本在日常口語中極少出現的詞彙，例如「underscore（強調）」、「meticulous（一絲不苟）」在ChatGPT面世後開始顯著增加，且具有單一性，這些詞彙的同義詞出現率並沒有隨同上升，這恐怕與LLM的學習資料來源有關。另一方面，有在大型AI公司內工作的工程師坦承，當高品質的文本早已被使用殆盡時，只能抓取社群或網路論壇的內容，固然這含有大量的口語化詞彙或引喻，比較接近日常生活口語，但隱晦、粗俗、諷刺甚至攻擊咒罵的內容也一併抓了進去，可能影響AI產出文字的品質。

重點是，當我們大量閱讀AI的輸出文字，也可能不知不覺吸收了它的「習慣」，並加以沿用在；而新的AI又會從被AI影響過的人類文字中繼續訓練。Schneier和Palmer指出這樣循環下去，可能影響的不只是我們怎麼寫字說話，而是我們怎麼認識自己、怎麼理解周遭發生的事。

更值得警惕的問題是AI的「過度認同（sycophancy，諂媚傾向）」。2026年3月，「科學」刊登了一項針對11個主要AI模型的研究，發現這些模型在回應個人建議類問題時，比人類更傾向認同使用者的行為，比例高出49%，即便那些行為涉及欺騙或違法。實驗顯示，僅僅一次與諂媚AI的對話，就足以讓參與者在事後更加確信自己是對的、更不願意承擔責任。

Schneier對此有更根本性的診斷：AI的諂媚傾向並不是技術本質，而是商業決策的產物。是企業選擇讓模型更討人喜歡、更容易讓人持續使用，而這個設計本身，正在扭曲人類的判斷與自我修正能力。

#我們能做什麼？

Schneier和Palmer坦言，他們沒有確定的答案。但他們提出了一個簡單的質問：如果人類有足夠的聰明才智建造出這些AI，應該也有能力想辦法讓它們從真正的人類口語中學習，而不是只從人類最刻板、最包裝過、有時也最不像自己的文字中學習。

這個問題在台灣同樣適用。我們每天在Line群組裡發的訊息、邊走邊隨口聊的閒話、在家族聚餐上爭執哪一黨比較好或差，這些才是語言最有生命力的地方，也是目前所有AI幾乎完全觸及不到的地方。不過當大人用AI作簡報、學生用AI寫作業時，我們其實已經自發性的參與進這個大型語言實驗裡了。

Page updated

Google Sites

Report abuse