日本午夜一区,中文字幕av一区二区三区佐山爱,影院在线观看全集免费观看,色婷婷av一区

加入收藏夾 設(shè)置首頁(yè)
當(dāng)前位置:首頁(yè) >科教
你被 AI 騙過嗎?新研究:一個(gè)方法能對(duì) AI “測(cè)謊”
來源:科普中國(guó) 2024-12-24 17:10:35
評(píng)論

胡說八道不可怕,一本正經(jīng)的胡說八道才可怕,你因?yàn)橐槐菊?jīng)而信了ta的胡說八道,更可怕……這就是當(dāng)下我們(捏著鼻子)使用 AI 時(shí)需要面對(duì)的現(xiàn)狀

如何避免 AI 生成虛假的事實(shí)內(nèi)容,對(duì)使用者產(chǎn)生誤導(dǎo)呢?各個(gè)大模型平臺(tái)一直在研究和嘗試,而要想“避免”問題,首先得“識(shí)別”問題。6 月 19 日,牛津大學(xué)一個(gè)研究團(tuán)隊(duì)發(fā)表在《自然》雜志上的一項(xiàng)新研究,提出了一種頗有潛力的給AI“測(cè)謊”的方法,下面咱們就詳細(xì)聊聊。

大模型的胡說八道和風(fēng)險(xiǎn)

“幻覺”(Hallucinations)是大語言模型(例如 ChatGPT、Gemini、或文心一言)面臨的一個(gè)關(guān)鍵問題,也是網(wǎng)絡(luò)上常見的用戶體驗(yàn)吐槽類型之一,這個(gè)術(shù)語可以粗略地理解為 AI 一本正經(jīng)的胡說八道

比如,你問 ChatGPT:恐龍扛狼是什么意思?

它會(huì)一本正經(jīng)地告訴你——這象征著舊勢(shì)力和新力量的對(duì)抗,是弱小但機(jī)智靈活的挑戰(zhàn)者和強(qiáng)大卻缺乏靈活的對(duì)手之間的博弈。

答案非常洗滌靈魂,上升到哲理和價(jià)值觀高度,但是,它在胡說八道。

圖片

這只是大語言模型常見的“幻覺”類型之一,其他類型還包括:

1、錯(cuò)誤的歷史事實(shí)

“誰是美國(guó)的第一位總統(tǒng)?” ChatGPT 回答:“托馬斯·杰斐遜。”

2、錯(cuò)誤的科學(xué)信息

“水的沸點(diǎn)是多少?” ChatGPT 回答:“水在標(biāo)準(zhǔn)大氣壓下的沸點(diǎn)是 120 攝氏度。”

3、編造引用,AI 縫合怪

“愛因斯坦在相對(duì)論中說了什么?” ChatGPT 回答:“愛因斯坦曾在《相對(duì)論與現(xiàn)實(shí)》一書中說過,‘時(shí)間是一種幻覺’。”雖然愛因斯坦的確討論過時(shí)間的相對(duì)性,但他并沒有在所謂的《相對(duì)論與現(xiàn)實(shí)》一書中發(fā)表這句話。實(shí)際上,這本書可能根本不存在。這是模型編造的引用。

4、誤導(dǎo)性的健康、法務(wù)、財(cái)務(wù)建議

你問:“感冒了應(yīng)該吃什么藥?” ChatGPT 回答:“感冒了應(yīng)該吃抗生素。”

除了上述問題,相信大家在使用 AI 的過程中也會(huì)碰到其他胡說八道的情況。盡管各個(gè)大模型都在積極處理這類問題,上面舉的例子很多可能也已經(jīng)得到了修復(fù),但這類問題一直難以找到“根治”或“清除”的辦法,在檢驗(yàn)判斷上也往往需要人工反饋或數(shù)據(jù)集標(biāo)注,這會(huì)帶來不低的成本。

這讓我們使用 AI 的體驗(yàn)大打折扣——誰敢毫無保留地信任一個(gè)滿嘴跑火車的助手呢何況有些問題事關(guān)健康和安全,弄錯(cuò)可是要出大事的。

有沒有什么辦法,能更通用化地“計(jì)算”出 AI 到底有沒有瞎說呢?

“語義熵”如何幫助大模型檢測(cè)謊言?

日前(6 月 19 日),牛津大學(xué)團(tuán)隊(duì)在《自然》(Nature)雜志發(fā)表了一篇論文,提出了一種新的分析和計(jì)算方法,為解決大語言模型“幻覺”問題,打開了新思路。

圖片

圖源:《自然》(Nature)官網(wǎng),中文翻譯來自瀏覽器插件“沉浸式翻譯”

團(tuán)隊(duì)提出了一種基于統(tǒng)計(jì)學(xué)的熵估計(jì)方法,稱為“語義熵”,來檢測(cè)大語言模型中的“編造”(confabulation),即大模型飽受詬病的“胡言亂語癥”。作者在多個(gè)數(shù)據(jù)集上測(cè)試了語義熵方法,結(jié)果顯示語義熵方法在檢測(cè)編造方面顯著優(yōu)于其他基準(zhǔn)方法。

那么“語義熵”究竟是什么呢?

拋開冗長(zhǎng)的專業(yè)解釋,我們可以將語義熵簡(jiǎn)單理解為概率統(tǒng)計(jì)的一種指標(biāo),用來測(cè)量一段答案中的信息是否一致。如果熵值較低,即大家都給出類似的答案,說明信息可信。但如果熵值較高,答案各不相同,說明信息可能有問題

這有點(diǎn)類似于,如果一個(gè)人在撒謊,他可能沒辦法每次把謊言的細(xì)節(jié)編造得一模一樣。一個(gè)謊言往往需要無數(shù)個(gè)謊言來幫它扯圓。從信息論的角度來看,可能會(huì)引入更多的不確定性和隨機(jī)性。說謊者需要引入額外的信息或細(xì)節(jié)來支持其不真實(shí)的敘述,這可能會(huì)增加信息的不確定性或熵值,進(jìn)而被算法檢測(cè)出來。

比如,當(dāng)你問 AI“世界上最高的山是哪座?”

大模型可能會(huì)給出幾個(gè)答案:“珠穆朗瑪峰”“乞力馬扎羅山”“安第斯山脈”。

通過計(jì)算這些答案的語義熵,發(fā)現(xiàn)“珠穆朗瑪峰”這個(gè)答案出現(xiàn)頻率最高,其他答案則很少甚至沒有出現(xiàn)。低語義熵值表明“珠穆朗瑪峰”是可信的答案。

語義熵,既有優(yōu)勢(shì),也有弱點(diǎn)

語義熵檢測(cè)方法的優(yōu)勢(shì)在于不需要任何先驗(yàn)知識(shí),無需額外的監(jiān)督或強(qiáng)化學(xué)習(xí)通俗地講,使用這種方法時(shí),并不需要上知天文下知地理,只需要遇事不決看看大家都怎么說。

而目前常用的諸如標(biāo)注數(shù)據(jù)、對(duì)抗性訓(xùn)練等方法,“泛化”效果(即舉一反三的能力),都不如通過語義熵計(jì)算。即便是大模型從未遇到過的新語義場(chǎng)景,也能適用語義熵方法。

當(dāng)然,語義熵雖然是一種相對(duì)有效的辦法,但不是萬靈藥,它自己也有一定局限性:

1、處理模糊和復(fù)雜問題的能力有限

語義熵在處理非常模糊或復(fù)雜的問題時(shí)可能不夠有效。

在面對(duì)多種可能正確答案的問題時(shí),比如“最好的編程語言是什么?”,語義熵可能無法明確區(qū)分哪一個(gè)答案更可靠,因?yàn)槎鄠€(gè)答案都可能是合理的。

(誰說是 Python?我 C++第一個(gè)不服!!)

2、忽略上下文和常識(shí)

語義熵主要基于統(tǒng)計(jì)和概率計(jì)算,可能忽略了上下文和常識(shí)的影響。在一些需要綜合上下文和常識(shí)來判斷的問題中,語義熵可能無法提供準(zhǔn)確的可靠性評(píng)估。比如經(jīng)常談戀愛的朋友可能有體會(huì),情侶間一句話:“我沒事兒,你忙吧。”

你覺得 TA 是真沒事兒,還是有很大事兒?

在這種情況下,得結(jié)合上下文場(chǎng)景、人物狀態(tài)等信息判斷,不同的上下文會(huì)導(dǎo)致不同的理解。語義熵只能基于詞語的統(tǒng)計(jì)概率進(jìn)行評(píng)估,可能會(huì)給出錯(cuò)誤的判斷。

再比如常識(shí)性的判斷,既物理世界的客觀規(guī)律,假設(shè)我們問一個(gè)問題:“太陽(yáng)從哪邊升起?”

正確答案是“東邊”。然而,如果我們有以下兩個(gè)候選答案:

1.太陽(yáng)從東邊升起。

2.太陽(yáng)從西邊升起。

(這可能由于模型訓(xùn)練數(shù)據(jù)的偏差和生成過程的隨機(jī)性導(dǎo)致)

即使語義熵檢測(cè)到兩個(gè)答案的概率分布接近,但常識(shí)告訴我們答案 1 才是正確的。語義熵在這種情況下可能無法提供足夠的信息來判斷答案的可靠性。

3、如果訓(xùn)練數(shù)據(jù)被無意或刻意“污染”,語義熵也沒辦法很好識(shí)別

如果用錯(cuò)誤的數(shù)據(jù),給大模型施加了“思想鋼印”,模型對(duì)其生成的錯(cuò)誤陳述非常“自信”(即錯(cuò)誤陳述在模型的輸出概率分布中占主導(dǎo)地位),那么這些陳述的熵值可能并不會(huì)很高。

最后總結(jié)一下,從大模型的內(nèi)容生成機(jī)制上看,“幻覺”問題沒辦法 100%避免。當(dāng)我們?cè)谑褂肁I生成的內(nèi)容時(shí),重要的數(shù)理推理、歷史事件或科學(xué)結(jié)論、法律和健康知識(shí)等方面最好進(jìn)行人工核查。

不過,換個(gè)角度,“幻覺”也是大語言模型的創(chuàng)造力體現(xiàn),我們也許應(yīng)該善用大模型的“幻覺”能力。畢竟幻覺不一定是 bug(故障),而是大模型的 feature(特點(diǎn))。

如果需要檢索事實(shí),我們已經(jīng)有了搜索引擎工具。但如果需要有人幫我們編輯一個(gè)“恐龍扛狼”的無厘頭劇本,那么,大語言模型顯然是個(gè)更好的助手。

圖片


比如筆者費(fèi)盡心思想畫一幅恐龍扛狼圖,但某 AI 油鹽不進(jìn),畫出了一幅恐龍把狼吞了(疑似)的圖,難怪理解不了恐龍扛狼的真意啊……

參考文獻(xiàn)

[1] S. Farquhar, J. Kossen, L. Kuhn, and Y. Gal, “Detecting hallucinations in large language models using semantic entropy,” Nature, vol. 630, no. 8017, pp. 625–630, 2024, doi: 10.1038/s41586-024-07421-0.

作者:木木

編輯:梁正城

記者:

評(píng)論

文明上網(wǎng) 理性發(fā)言

登錄
全部評(píng)論 0條評(píng)論
加載中...

請(qǐng)先登錄

取消
確定
日本午夜一区,中文字幕av一区二区三区佐山爱,影院在线观看全集免费观看,色婷婷av一区
国产在线不卡视频| 91久色porny| 国产日产精品一区二区三区四区| 日韩av一区二区三区在线观看 | 亚洲丝袜精品丝袜在线| 日本va欧美va瓶| 99免费精品视频| 日韩久久在线| 精品日韩欧美在线| 亚洲一区二区五区| 成人午夜激情片| 欧美午夜精品理论片a级大开眼界| 欧美日韩日日摸| 中文字幕中文字幕中文字幕亚洲无线 | 91福利精品视频| 日本一区二区免费在线 | 国产成人一区在线| 免费久久99精品国产自| 欧美精品一卡两卡| 亚洲三级免费观看| 国产福利一区二区三区| 欧美午夜欧美| 日韩欧美二区三区| 亚洲午夜羞羞片| av色综合久久天堂av综合| 亚洲人成77777| 国产日韩精品一区二区三区在线| 奇米影视在线99精品| 国产成人免费观看| 欧美区视频在线观看| 亚洲色图清纯唯美| 成人性生交大合| 中文字幕一区二区三区有限公司| 久久精品男人的天堂| 精品一二线国产| 就去色蜜桃综合| 欧美电影免费观看高清完整版在 | 亚洲一区二区三区中文字幕 | 国产精品丝袜一区| 国产精品资源网| 日韩一区二区三区资源| 久久精品欧美日韩精品| 狠狠久久亚洲欧美| 色一情一乱一伦一区二区三区丨| 久久久久久久av麻豆果冻| 久久国产精品第一页| 欧美日韩精品免费观看| 久久久久亚洲综合| 国产一区二区成人久久免费影院| 日韩欧美一区二区三区四区| 国产欧美日本一区视频| 高潮精品一区videoshd| 色综合 综合色| 亚洲精品一二三四区| 99re视频在线播放| 欧美一级理论性理论a| 日本不卡1234视频| 欧美综合77777色婷婷| 国产拍揄自揄精品视频麻豆| 国产91在线看| 欧美亚男人的天堂| 亚洲成av人**亚洲成av**| 狠狠色综合色区| 久久久久久**毛片大全| 国产精品66部| 欧美三级蜜桃2在线观看| 亚洲成人激情综合网| 久久久久网址| 中文字幕精品综合| av中文字幕在线不卡| 7777精品久久久大香线蕉| 日韩高清在线观看| 午夜精品福利一区二区| 亚洲欧美日韩系列| 国产一区二区中文字幕免费看| 91精品一区二区三区在线观看| 免费高清视频精品| 一区二区免费在线观看| 夜夜嗨av一区二区三区中文字幕| 国产欧美日韩亚洲| 国产色产综合产在线视频| 不卡电影一区二区三区| 91精品国产综合久久小美女| 久久99精品久久久久久久久久久久| 亚洲国产精品www| 一区二区三区av电影 | 懂色av一区二区在线播放| 欧美精品一二三区| 久久成人免费日本黄色| 在线观看日韩精品| 免费一区二区视频| 91国偷自产一区二区三区成为亚洲经典| 亚洲电影激情视频网站| 日韩中文字幕一区二区| 亚洲一区二区视频在线观看| 欧美自拍资源在线| 亚洲永久免费av| 日本在线观看一区| 亚洲一区二区三区四区的| 日韩激情视频| 亚洲狠狠爱一区二区三区| 四虎永久在线精品免费一区二区| 亚洲制服丝袜一区| 色狠狠久久av五月综合| 亚洲国产欧美另类丝袜| 亚洲一区综合| 日韩不卡一区二区| 在线看日本不卡| 极品销魂美女一区二区三区| 欧美体内she精高潮| 国内精品不卡在线| 91精品黄色片免费大全| 成人av网址在线| 久久久久青草大香线综合精品| 99国产盗摄| 国产精品福利在线播放| 欧美高清一区二区| 亚洲国产毛片aaaaa无费看| 亚洲国产高清国产精品| 日韩av二区在线播放| 欧美午夜电影网| 国产乱一区二区| 日韩欧美亚洲一区二区| 91视频一区二区三区| 国产精品理论在线观看| 欧美一区二区高清在线观看| 亚洲444eee在线观看| 在线观看亚洲精品视频| 国产麻豆精品95视频| 精品国产91亚洲一区二区三区婷婷 | 欧美美女一区二区在线观看| 国产91精品露脸国语对白| 久久久久久电影| 久久久久一区二区| 爽爽淫人综合网网站| 欧美日本在线观看| 91原创在线视频| 综合久久一区二区三区| 亚洲视频精品一区| 国产综合色产在线精品| 亚洲精品在线观看网站| 国内精品视频在线播放| 亚洲bdsm女犯bdsm网站| 在线不卡中文字幕| 2022国产精品| 一区二区高清在线| 欧美三级视频在线| 91一区二区在线| 亚洲精品免费看| 欧美中文字幕一区| 99久久免费国产| 亚洲男同1069视频| 在线视频国内自拍亚洲视频| 成人久久18免费网站麻豆| 国产精品麻豆网站| 自拍亚洲欧美老师丝袜| 国产成人综合网| 国产精品久久久久久久第一福利| 亚洲成人第一| 国产成人8x视频一区二区| 国产精品卡一卡二卡三| 中文字幕在线中文字幕日亚韩一区| 国产激情一区二区三区四区| 国产精品免费视频观看| 亚洲在线观看一区| 成人网在线播放| 亚洲青青青在线视频| 欧美亚洲国产bt| av在线不卡一区| 日韩精品91亚洲二区在线观看| 日韩欧美色综合| 蜜桃91精品入口| 久草精品在线观看| 国产精品色一区二区三区| 色综合久久中文综合久久97| 成+人+亚洲+综合天堂| 亚洲精品国产无天堂网2021| 欧美嫩在线观看| 精选一区二区三区四区五区| 另类专区欧美蜜桃臀第一页| 国产亚洲欧美色| 色八戒一区二区三区| 91色.com| 青青草成人在线观看| 久久精品亚洲麻豆av一区二区 | 国产精品免费在线播放| 全部av―极品视觉盛宴亚洲| 亚洲精品一区二区三区香蕉| 亚洲春色在线| 91丨九色丨蝌蚪丨老版| 日日欢夜夜爽一区| 国产欧美日韩精品在线| 日本韩国欧美在线| 国产精品成人一区二区三区 | 亚洲精品欧美激情| 日韩天堂在线观看| 亚洲欧洲日韩精品| 91丨国产丨九色丨pron| 看电视剧不卡顿的网站| 亚洲日本在线看|