首頁>要聞
僅憑聊天頻率 這個(gè)算法就能辨別誰是潛在網(wǎng)絡(luò)違法者
研究者認(rèn)為,借助AI,系統(tǒng)管理員能更好地維護(hù)網(wǎng)絡(luò)安全和用戶權(quán)益。盡管目前的AI不能進(jìn)一步預(yù)測(cè)違法事件的具體類型,但它或許能抓住網(wǎng)絡(luò)上“隱形”的違法者,更好地保護(hù)我們的安全。
隨著網(wǎng)絡(luò)的普及,網(wǎng)絡(luò)違法事件也成為了不容忽視的社會(huì)問題?;ヂ?lián)網(wǎng)消弭了潛在違法者和受害者之間的時(shí)空距離,使得人人都有客觀條件違法,而人人也有被傷害的危險(xiǎn)。中國(guó)司法大數(shù)據(jù)研究院發(fā)布的《網(wǎng)絡(luò)犯罪特點(diǎn)和趨勢(shì)(2016.1—2018.12)》報(bào)告指出,社交類平臺(tái),尤其是QQ、微信等已經(jīng)成為虛擬犯罪的主要工具,不法分子通過它們?cè)诰W(wǎng)絡(luò)上策劃、實(shí)施犯罪行為。這種過程不需要現(xiàn)實(shí)接觸,因此非常難捕捉,給執(zhí)法帶來了許多困難。
近日,日本德島大學(xué)的計(jì)算機(jī)研究者聯(lián)合日本大型網(wǎng)絡(luò)公司代理商Cyber Agent在《人類行為計(jì)算》上發(fā)表論文,他們用機(jī)器學(xué)習(xí)的方法,分析了Cyber Agent旗下一款社交類游戲的使用數(shù)據(jù),并且在不監(jiān)測(cè)聊天內(nèi)容的情況下,僅基于聊天次數(shù)、聊天對(duì)象、聊天時(shí)間等基本信息,就能較為精準(zhǔn)地識(shí)別出潛在網(wǎng)絡(luò)違法者,并預(yù)測(cè)出違法行為的大概時(shí)間。
“疑犯追蹤”的理論基礎(chǔ)
這不是一個(gè)異想天開的想法。盡管在游戲中大家只是依靠網(wǎng)線交流,但我們?cè)诰W(wǎng)上的行為也留下了海量數(shù)據(jù),為預(yù)測(cè)網(wǎng)絡(luò)違法行為提供了豐富的材料。
研究者基于兩種傳統(tǒng)犯罪學(xué)理論開發(fā)了這套算法:日?;顒?dòng)理論和社會(huì)傳染理論。
日?;顒?dòng)理論提出,許多犯罪行為并不是隨機(jī)發(fā)生的,犯罪者和被害人往往在日?;顒?dòng)中有交集。例如,在現(xiàn)實(shí)生活中,小偷在盜竊前會(huì)去目標(biāo)地點(diǎn)踩點(diǎn),并觀察目標(biāo)人物的行為規(guī)律;同樣的,網(wǎng)絡(luò)上的犯罪者更需要提前與“獵物”取得聯(lián)系,套取信任。因此,玩家的社交活動(dòng)數(shù)據(jù)中或許就藏著“犯罪預(yù)告”。
另外,社會(huì)傳染理論還補(bǔ)充了重要的一點(diǎn):違法傾向或違法行為也會(huì)傳染。最常見的例子就是網(wǎng)絡(luò)暴力。網(wǎng)絡(luò)暴力往往來源于某種過激情緒的廣泛傳播:在群體的裹挾下,有的人不知不覺就失去了獨(dú)立判斷能力,無意間成為了網(wǎng)上的施暴者。有研究指出,在“目睹”群體內(nèi)其他人的網(wǎng)絡(luò)騷擾行為后,旁觀者也很容易對(duì)同一名受害者發(fā)起攻擊,或者嘗試騷擾其他人。這樣的傳染行為也為預(yù)測(cè)網(wǎng)絡(luò)違法事件提供了重要的對(duì)象和時(shí)間線索。
在這兩種理論的基礎(chǔ)上,研究者選擇了是一款名叫Pigg Party的手機(jī)游戲。它主打社交功能,用戶登錄賬號(hào)后,可以裝扮虛擬的房間和個(gè)人形象,與朋友或陌生人以私聊、群聊、公聊的方式進(jìn)行交流。研究人員采用擅長(zhǎng)從復(fù)雜數(shù)據(jù)中提取特征的算法——多層非線性模型,對(duì)55萬用戶6個(gè)月內(nèi)產(chǎn)生的聊天數(shù)據(jù),包括每名用戶的聊天頻率、聊天時(shí)間、消息的接收者等進(jìn)行了分析。
想做壞事的心逃不過AI的眼
研究者組合多種神經(jīng)網(wǎng)絡(luò)模型和算法,搭建了預(yù)測(cè)違法事件的人工智能。性能測(cè)試結(jié)果顯示, AI能根據(jù)用戶數(shù)據(jù),較為準(zhǔn)確地預(yù)測(cè)未來的違法者和受害者賬戶。輸入用戶兩個(gè)月內(nèi)聊天的時(shí)間、頻率、對(duì)象,AI對(duì)接下來兩個(gè)月內(nèi)違法賬戶的預(yù)測(cè)準(zhǔn)確率可以達(dá)到84.85%,對(duì)受害者賬戶的預(yù)測(cè)準(zhǔn)確度也接近85%。
除了對(duì)個(gè)體賬戶違法或受害的風(fēng)險(xiǎn)有較好的預(yù)測(cè)能力外,只需提供一周內(nèi)的用戶活動(dòng)數(shù)據(jù),AI就能基本精準(zhǔn)地預(yù)測(cè)接下來的一周網(wǎng)絡(luò)社區(qū)里發(fā)生違法事件的時(shí)間,對(duì)小時(shí)和日期的預(yù)測(cè)準(zhǔn)確率高達(dá)95.83%和85.71%,并且結(jié)果與預(yù)測(cè)受害給出的時(shí)間相吻合。更有趣的是,AI分析數(shù)據(jù)后預(yù)警發(fā)生違法事件的時(shí)間,并不一定處在以往發(fā)生違法事件的時(shí)間段中,可見它掌握的并不僅僅是固定的規(guī)則,還有違法者言行中的真正“邏輯”。
可進(jìn)行違法預(yù)測(cè)的AI將海量、零散分布的用戶日?;顒?dòng)記錄壓縮轉(zhuǎn)化成可以定量分析的數(shù)據(jù),并從中提煉、理解規(guī)律,最終形成了強(qiáng)大的預(yù)測(cè)能力。研究者認(rèn)為,借助AI,系統(tǒng)管理員能更好地維護(hù)網(wǎng)絡(luò)安全和用戶權(quán)益。盡管目前的AI并且不能進(jìn)一步預(yù)測(cè)違法事件的具體類型,但它或許能抓住網(wǎng)絡(luò)上“隱形”的違法者,更好地保護(hù)我們的安全。(◎?qū)O琳鈺 據(jù)《環(huán)球科學(xué)》)
編輯:付振強(qiáng)
關(guān)鍵詞:網(wǎng)絡(luò) 預(yù)測(cè) 聊天 違法