兩種算法通過識別重復的字詞的不同使用方式,只需要50條推特就能準確區(qū)分謠言和公眾人物發(fā)表的消息。來自德國耶拿的弗里德里?!は沾髮W(Friedrich Schiller University)的Sergei Monakhov于2020年8月12日在開放期刊PLOS ONE上發(fā)表了這些發(fā)現(xiàn)。
網(wǎng)絡謠言被用于達成某個目的,但同時也隱藏了該目的。比如說,在2018年,13個俄羅斯人被指控使用虛假身份通過社交媒體干涉2016年美國總統(tǒng)選舉。雖然之前的研究已經(jīng)包含了能區(qū)分虛假消息的特征,比如說時間、主題標簽,還有地理位置,但很少有研究分析推特消息本身的語言特征。
Monakhov使用了一種社會語言學方法,中心思想就是造謠者想傳播的消息數(shù)量有限,但是他們會多次發(fā)消息并使用足夠多樣的措辭和主題來欺騙讀者。Monakhov使用一個含有俄羅斯造謠者推特和真正的美國國會推特的庫,證明了這些專屬造謠者的特點最終能區(qū)分謠言和官方推特消息的重復字詞模式。
美國國會、造謠者和特朗普的50條隨機推特的貝葉斯分析結(jié)果。 (圖片來源:Monakhov, 2020)
之后Monakhov測試了這一使用不同模式區(qū)分官方消息和謠言的算法。他發(fā)現(xiàn)這種算法只需要50條推特消息就能準確區(qū)分造謠者和官方。他還發(fā)現(xiàn)這種算法正確地分辨了特朗普和造謠者的推特,盡管特朗普發(fā)表的消息也被推特官方認為是挑釁的和“可能導致誤解的”,但是并沒有隱藏發(fā)表意圖。
這種區(qū)分推特謠言的新方法能幫助對抗網(wǎng)絡戰(zhàn)的同時保護言論自由。更多的研究將注重于確定該方法是否能準確地從不是公眾人物發(fā)表的其他類型的消息中區(qū)分謠言。
圖片來源:Pixabay
Monakhov補充:“雖然謠言的撰寫被認為是充滿反復消息的,但它們最具特點的特征是非常規(guī)的重復字詞分布。把這些特征字詞的比例作為量化測量標準,我們只需要50條推特就能識別網(wǎng)絡謠言賬戶?!?/p>
翻譯:王嘉鈺
審校:郝豪
引進來源:Public Library of Science
引進鏈接:https://techxplore.com/news/2020-08-strategy-quickly-twitter-trolls.html
?
關注【深圳科普】微信公眾號,在對話框:
回復【最新活動】,了解近期科普活動
回復【科普行】,了解最新深圳科普行活動
回復【研學營】,了解最新科普研學營
回復【科普課堂】,了解最新科普課堂
回復【科普書籍】,了解最新科普書籍
回復【團體定制】,了解最新團體定制活動
回復【科普基地】,了解深圳科普基地詳情
回復【觀鳥知識】,學習觀鳥相關科普知識
回復【博物學院】,了解更多博物學院活動詳情
?