-
麻省理工研究新成果:AI可識別假新聞 還能辨別個人偏見
關鍵字:互聯網時代,假新聞鋪天蓋地,而且極具迷惑性,Facebook一度深陷虛假新聞的泥淖,不但被控影響了美國總統大選結果,甚至引發了德國政府的巨額罰金。甚至連以公信力著稱的BBC也難以幸免,比如BBC北安普頓分站的推特賬號就曾發過這樣一條消息:
Breaking News: President Trump is injured in arm by gunfire #Inauguration.(勁爆消息:特朗普總統在就職典禮后遭遇槍擊,手臂受傷。)
10月4日,麻省理工學院計算機科學與人工智能實驗室(CSAIL)在其官網發布了一則新聞,宣稱該實驗室與卡塔爾計算研究所(Qatar Computing Research Institute)的研究人員合作,已經研究出一種可以鑒別信息來源準確性和個人政治偏見的AI系統,該研究成果將于本月底在比利時布魯塞爾召開的2018自然語言處理經驗方法會議(EMNLP)上正式公布。
研究人員用這個AI系統創建了一個包含1000多個新聞源的開源數據集,這些新聞源被標注了“真實性”和“偏見”分數。據稱,這是類似數據集中收錄新聞源數量最多的數據集。
研究人員寫道:“打擊‘假新聞’的一種(有希望的)方法是關注消息來源。”“雖然‘假新聞’(帖子)主要在社交媒體上傳播,但他們仍然有最初來源,即某個網站,因此,如果一個網站曾經發布過假新聞,很有可能未來還會發布。”
AI系統的新穎之處在于它對所評估的媒介有廣泛的語境理解,沒有單獨從新聞文章中提取特征值(機器學習模型所訓練的變量),而是兼顧了維基百科、社交媒體,甚至根據url和web流量數據的結構來確定可信度。
該系統支持向量(SVM)訓練來評估事實性和偏差,真實性分為:低、中、高;政治傾向分為:極左、左、中偏左、中偏右、右、極右。
根據該團隊所述,系統只需檢測150篇文章就可以確定一個新的源代碼是否可靠。它在檢測一個新聞來源是否具有高、低或中等程度的“真實性”方面的準確率為65%,在檢測其政治傾向是左傾、右傾還是中立方面的準確率為70%。
AI系統分析示例
在上圖顯示的文章中,AI系統對文章的文案和標題進行了六個維度的測試,不僅分析了文章的結構、情感、參與度(在本例中,分析了股票數量、反應和Facebook上的評論),還分析了主題、復雜性、偏見和道德觀念,并計算了每個特征值的得分,然后對一組文章的得分進行平均。
“真實性-偏見”預測模型圖
維基百科和Twitter也被加入了AI系統的預測模型。正如研究者們所言,維基百科頁面的缺失也許說明了一個網站是不可信的,或者網頁上可能會提到這個問題的政治傾向是諷刺的或者明顯是左傾的。此外,他們還指出,沒有經過驗證的Twitter賬戶,或者使用新創建的沒有明確標注的賬戶發布的消息,不太可能是真的。
該模型的最后兩個向量是URL結構和web流量,可以檢測試圖模仿可信新聞來源的url(例如,“foxnews.co”),參考的是一個網站的Alexa排名,該排名根據網站總瀏覽量進行計算。
該團隊在MBFC(Media Bias/Fact Check )網站的1066個新聞源上對此AI系統進行了訓練。他們用收集的準確性和偏見數據手工標注網站信息,為了生成上述數據庫,研究人員在每個網站上發布了10-100篇文章(總計94,814篇)。
正如研究人員在他們的報告中煞費苦心的介紹所示,并不是每一個特征值都能有效預測事實準確性或政治偏見。例如,一些沒有維基百科頁面或建立Twitter檔案的網站有可能發布的信息是公正可信的,在Alexa排名靠前的新聞來源并不總是比流量較少的新聞源更公正或更真實。
研究人員有一個有趣的發現:來自虛假新聞網站的文章更有可能使用夸張和情緒化的語言,左傾媒體更有可能提到“公平”和“互惠”。與此同時,擁有較長的維基百科頁面的出版物通常更可信,那些包含少量特殊字符和復雜子目錄的url也是如此。
未來,該團隊打算探索該AI系統是否能適應其他語言(它目前只接受過英語訓練),以及是否能被訓練來檢測特定區域的偏見。他們還計劃推出一款App,可以通過“跨越政治光譜”的文章自動回復新聞。
該論文的第一作者、博士后助理拉米?巴利(Ramy Baly)表示:“如果一個網站以前發布過假新聞,他們很可能會再次發布。”“通過自動抓取這些網站的數據,我們希望我們的系統能夠幫助找出哪些網站可能首先這么做。”
當然,他們并不是唯一試圖通過人工智能打擊假新聞傳播的機構。
總部位于新德里的初創公司MetaFact利用NLP算法來標記新聞報道和社交媒體帖子中的錯誤信息和偏見;SAAS平臺AdVerify.ai于去年推出beta版,可以分析錯誤信息、惡意軟件和其他有問題的內容,并可以交叉引用一個定期更新的數據庫,其中包含數千條虛假和合法的新聞。
前文中也提到過,Facebook一度深陷假新聞的泥淖,已經開始嘗試使用“識別虛假新聞”的人工智能工具,并于近期收購了總部位于倫敦的初創公司Bloomsbury AI,以幫助其鑒別消除假新聞。
假新聞會被消除嗎?
然而,一些專家并不相信人工智能可以勝任這項任務。卡內基梅隆大學機器人研究所(Carnegie Mellon University Robotics Institute)的科學家迪恩波默洛(Dean Pomerleau)在接受外媒 the Verge 采訪時表示,人工智能缺乏對語言的微妙理解,而這種理解是識別謊言和虛假陳述所必需的。
“我們最初的目標是建立一個系統來回答‘這是假新聞,是或不是?’”他說,“但我們很快意識到,機器學習無法勝任這項任務。”
但是,人類事實核查者做的不一定比AI更好。今年,谷歌暫停了“事實核查”(Fact Check)這一標簽,該標簽曾位于谷歌新聞報道欄,此前保守派媒體也曾指責谷歌對他們表現出了偏見。
不過,無論最終鑒別假新聞和個人偏見的解決方案是AI系統還是人工,抑或兩者兼而有之,假新聞被徹底消除的那一天都不會立刻到來。
據咨詢公司Gartner預測,到2022年,如果目前的趨勢不變,大多數發達國家的人看到的虛假信息將會多于真實信息。
- 原標題:MIT新研究成果:AI可識別假新聞 還能辨別個人偏見
- 責任編輯:趙曉明
- 最后更新: 2018-10-06 17:53:37
-
谷歌同意就年齡歧視案和解 金額未公開
2018-10-06 16:04 -
戴爾時隔5年再次申請紐交所上市 估值將達700億美元
2018-10-06 08:50 商業 -
13名民企專家進入火箭軍“智庫”,與國家隊待遇同等
2018-10-06 08:30 科技前沿 -
硬件被植入中國“惡意芯片”?蘋果亞馬遜辟謠
2018-10-05 16:40 網絡謠言 -
最大規模中國人基因組測序完成 發現獨特病毒DNA分布
2018-10-05 15:00 科技前沿 -
谷歌無人車離奇車禍曝光:人類安全員睡著后,誤觸關閉了自動駕駛
2018-10-04 21:17 -
歐洲宇航員正學中文 盼能搭“神舟”
2018-10-04 12:01 航空航天 -
今年諾貝爾化學獎被生物學家搶走了
2018-10-04 09:35 諾貝爾獎 -
“逃犯克星”:國家技術太先進,要做該做的事情
2018-10-03 23:04 依法治國 -
騰訊3.176億美元增持B站股份
2018-10-03 22:29 大公司 -
軟銀或5億美元投“作業幫”
2018-10-03 20:36 商業 -
第三位物理諾獎女性得主:偶然加班讓她比肩居里夫人?
2018-10-03 08:35 諾貝爾獎 -
陳列平與諾獎失之交臂 原因有三
2018-10-03 08:26 諾貝爾獎 -
電視臺再遇寒冬 衛視招商淪為求生欲大作戰
2018-10-02 20:32 -
Win10政府版未過審核卻被地方政府采購折射自主可控亂局
2018-10-02 20:15 -
一下科技的十字路口
2018-10-02 20:08 -
55年來首位女性!美法加激光物理學家分享諾獎
2018-10-02 18:04 -
18年來,日本人年均拿一個諾獎
2018-10-02 16:16 日本 -
嫦娥六號將搭載10公斤國際載荷
2018-10-02 15:28 航空航天 -
90秒,展現魔都科技工業之美!
2018-10-02 15:08 觀網看片
相關推薦 -
“中國在非洲真正贏得了民心,就連斯威士蘭…” 評論 70“日企抱團是絕望之舉,中國工廠效率質量都是第一” 評論 113“她下月訪華,盡管特朗普團隊表達了擔憂” 評論 53“中國有能力讓夢想照進現實,將贏得史詩般競爭” 評論 120最新聞 Hot
-
“中國在非洲真正贏得了民心,就連斯威士蘭…”
-
“日企抱團是絕望之舉,中國工廠效率質量都是第一”
-
“中國有能力讓夢想照進現實,將贏得史詩般競爭”
-
被災民暴罵到當場破防,馬克龍發飆:你該慶幸你在法國!
-
美高校敦促國際學生抓緊回來:萬一把中印拉黑名單呢
-
美國政府“逃過一劫”
-
“澤連斯基要求歐盟新外長:對華批評要降調”
-
澳大利亞來了,中國就得走人?澳總理這么回應
-
美媒感慨:基建狂魔發力,我們又要被超越了
-
英國剛公布新任大使,特朗普顧問就痛罵:傻X
-
“來自中國的老大哥能確保我們…”
-
俄羅斯的報復來了
-
澤連斯基罵普京“傻子”,俄方怒斥
-
還在扯皮中國,“涉華條款全刪了”
-
中國“光伏OPEC”發文嚴厲質問央企,怎么回事?
-
“最后一道貿易障礙,中國解除了!”
-