2020內容科技應用典型案例:人民網-中科睿鑒新聞可信度識別支撐系統
一、概述
目前國內已有的主要識謠、辟謠平台基本還是依靠專家識別模式,其存在一定的問題:發現線索主要依賴用戶舉報,數量有限,時效性不強﹔新聞認証速度有待提高。為提高謠言識別的效率,人民網與中科院計算所合作,採用“人工智能”技術作為有效輔助工具,建立了高效的識謠平台——新聞可信度識別支撐系統。
二、實現方式
人民網與中科院計算所合作建設的新聞可信度識別支撐系統充分利用人工智能、知識圖譜、全媒體可信大數據訓練,以知識內容為根基框架,全面解析、演繹歸納傳播內容認知的精准需求,自動及時發現可疑線索並進行認証,大大降低謠言可能帶來的危害﹔通過機器學習算法輔助人工審核,僅需1分鐘即能對疑似謠言事件發出預警﹔基於數據驅動的方法,平台還可不斷挖掘出不同類別謠言的特性,實現對各種謠言的自動識別。
(一)核心技術
從核心技術上,AI甄別謠言依賴“三多”:
一是多模態數據,謠言從發布、傳播到被辟謠的生命周期中,可能會伴隨產生文字、圖片、視頻、傳播網絡、參與用戶屬性等多種模態的數據,各模態數據均能不同程度指示謠言,例如謠言文字的情感傾向、圖片的視覺沖擊力、傳播網絡的結構屬性等。
二是多層次表示,深度學習技術有強大的表示學習能力,經過神經網絡結構和融合機制的設計,AI模型可以在面對眾多意義、形式、結構都不同的模態數據時,綜合不同層次數據,自動找出最有區分能力的表示組合,並將待甄別文章對應的文字、圖片、傳播網絡等融合投射到特征空間中。
三是多角度判斷,AI可以從單一方面(如內容、用戶、傳播)給出可信度,也可以全面觀察,給出綜合所有信息的可信度,及時幫助人們“揪出”可信度不高的信息。
(二)計算方式
第一,該模型會追溯信息源,分析用戶畫像。包括:專業領域、先前傳播或轉發內容,主體性質,注冊時間,活躍規律等,來判斷發布者是否“可靠”。最后根據不同態度的人群比例、各自的信譽度等信息,計算出此新聞的可信度。
第二,確認信息源的來源是否可信。該系統會搜尋網上所有的信息源,看看鏈接的域名,是否來自可信網站。比如是否來自新華社、政府醫藥管理局等官方網站。
第三,提煉與驗証。將正文裡關鍵的論証提煉為知識點,與知識圖譜裡的權威知識庫做匹配驗証。如果存在毫無聯系、自相矛盾,則會自動識別。
三、應用模塊
(一)內容生產模塊
支持最快10分鐘內發現互聯網上的爭議性新聞線索,對高危可疑事件及時發出預警,並對事件進行深度立體化分析,展示事件的關鍵參與者、關鍵地域、相關新聞、事件發展脈絡等多維証據鏈,輔助人工審核。同時,違規內容鑒定體系,可從色情、BK、政治敏感、視頻版權等角度對內容進行過濾。
(二)去偽求真模塊
人民網《求真》欄目除了鼓勵廣大網民通過微博、微信積極爆料之外,同時也通過智能辟謠平台提供的識別謠言的能力,確保第一時間獲得調查線索。網民、媒體、平台三方密切配合,極大地擴展了信息來源渠道,繼而形成一個高效專業的辟謠渠道。
(三)公眾服務模塊
疫情專題---新冠肺炎疫情24小時爭議性新聞播報系統:支持最快10分鐘發現爭議線索﹔支持按熱點主題檢索﹔支持按地域分類檢索(疫情地圖)。為公眾提供及時、准確的專題信息。
四、應用效果
人民網通過將可信度識別支撐系統的能力嵌入到新聞監測和內容管理系統中,讓人工智能通過新聞自動審核給與編輯可信度信息的手段參與到內容生產過程,基本覆蓋了人民網所有頻道新聞內容生產流程,極大地提高了新聞的准確性以及內容生產的效率。目前,此系統已入選中宣部“2020年中國報業深度融合發展創新案例”。
五、結語
隨著互聯網技術的不斷進步與發展,智能識謠平台將進一步提升“人工智能+大數據”的技術能力,積極拓展“智能計算設施在內容傳播領域的應用”方向的研究,結合人民網海量媒體資源庫,構建更高效、更精准、更廣泛的媒體界“反欺詐平台”,為業界共享沉澱下來“虛假信息庫”,為傳播內容認知國家重點實驗室提供優質數據支撐與應用場景,為更多平台提供保駕護航,為更多百姓提供真實准確的媒體資訊,為社會構建安全、干淨的資訊環境做出持續貢獻。
分享讓更多人看到
推薦閱讀
相關新聞
- 評論
- 關注