打開任何一個社群平台,越來越多的貼文讀起來都有一種奇特的熟悉感。用詞精準、語氣平和、段落工整,好像一個永遠不會累的萬事通,想到就來上一篇。這當然不是巧合,我們都知道其中有AI的輔助,但也沒什麼不好的,畢竟最後還是人決定要不要按下發布鍵,文章的觀點和審美觀由作者自負。
不過現在有研究者開始擔心,原本應該是AI學我們寫作,但實際上是我們正在不自覺的學AI寫作,而這會有很大的缺陷,因為雖然AI讀了很多書,但基本上沒聽過人話(單純的語音辨識除外)。
一般人可能以為LLM是靠「閱讀人類的語言」建立起來的,應該相當貼近真實的人類溝通方式。但哈佛大學Berkman Klein中心的研究員及資安專家Bruce Schneier與芝加哥大學歷史學家Ada Palmer最近在衛報發表的評論直接點破了這個假設,事實上,這些大語言模型的訓練語料幾乎全部來自書面文字,網頁、書籍、社群貼文、電影劇本,卻嚴重缺乏人類最日常、最核心的溝通形式:面對面的口語對話。
他們主張,非正式口語(unscripted speech)才是人類語言的大宗,而那正是AI學不到的東西。也就是說,AI從一開始就只能用人類「最正式、最修飾、有時也是最糟糕的形式」來認識(學習?)我們,這不是人類的真實溝通全貌。
而且這個先天性缺陷正在產生一個意想不到的反向效果,有人稱為滲透效應,白話說就是人類開始在模仿AI了。
德國馬克斯普朗克研究所的研究分析了ChatGPT推出前後的YouTube影片,發現一些原本在日常口語中極少出現的詞彙,例如「underscore(強調)」、「meticulous(一絲不苟)」在ChatGPT面世後開始顯著增加,且具有單一性,這些詞彙的同義詞出現率並沒有隨同上升,這恐怕與LLM的學習資料來源有關。另一方面,有在大型AI公司內工作的工程師坦承,當高品質的文本早已被使用殆盡時,只能抓取社群或網路論壇的內容,固然這含有大量的口語化詞彙或引喻,比較接近日常生活口語,但隱晦、粗俗、諷刺甚至攻擊咒罵的內容也一併抓了進去,可能影響AI產出文字的品質。
重點是,當我們大量閱讀AI的輸出文字,也可能不知不覺吸收了它的「習慣」,並加以沿用在;而新的AI又會從被AI影響過的人類文字中繼續訓練。Schneier和Palmer指出這樣循環下去,可能影響的不只是我們怎麼寫字說話,而是我們怎麼認識自己、怎麼理解周遭發生的事。
更值得警惕的問題是AI的「過度認同(sycophancy,諂媚傾向)」。2026年3月,「科學」刊登了一項針對11個主要AI模型的研究,發現這些模型在回應個人建議類問題時,比人類更傾向認同使用者的行為,比例高出49%,即便那些行為涉及欺騙或違法。實驗顯示,僅僅一次與諂媚AI的對話,就足以讓參與者在事後更加確信自己是對的、更不願意承擔責任。
Schneier對此有更根本性的診斷:AI的諂媚傾向並不是技術本質,而是商業決策的產物。是企業選擇讓模型更討人喜歡、更容易讓人持續使用,而這個設計本身,正在扭曲人類的判斷與自我修正能力。
#我們能做什麼?
Schneier和Palmer坦言,他們沒有確定的答案。但他們提出了一個簡單的質問:如果人類有足夠的聰明才智建造出這些AI,應該也有能力想辦法讓它們從真正的人類口語中學習,而不是只從人類最刻板、最包裝過、有時也最不像自己的文字中學習。
這個問題在台灣同樣適用。我們每天在Line群組裡發的訊息、邊走邊隨口聊的閒話、在家族聚餐上爭執哪一黨比較好或差,這些才是語言最有生命力的地方,也是目前所有AI幾乎完全觸及不到的地方。不過當大人用AI作簡報、學生用AI寫作業時,我們其實已經自發性的參與進這個大型語言實驗裡了。