由筑波大學計算科學中心Hiroyuki Kitagawa教授領導的研究小組在社交網絡(以下簡稱SNS)的網絡大數據分析中從節點(用戶)的年齡和性別等屬性標籤估計未知標籤. 開發技術。它是在美國舉辦的 2016 SIAM 國際數據挖掘會議上宣布的。

 隨著信息技術的進步,社會上飛來飛去的數據量呈爆炸式增長。在這種情況下,對大數據的利用提出了強烈的要求,尤其是如何利用包含大量有用信息的網絡數據成為重點。

 例如,在SNS中,每個節點都可以給出對應用戶的年齡、居住地等作為“屬性標籤”,但有些節點並沒有明確標明。為了搜索作為鏈接節點內容的重要補充信息的標籤信息,需要從網絡數據中的已知標籤估計未知標籤的“標籤估計”,並且迄今為止已經使用了各種類型。被開發。但是,存在無法適用於標籤不同的節點容易相互連接的網絡數據的問題。

 在本次提出的方法中,作為基本思想,除了常規的“比率”之外,還考慮了“絕對數”,將與“可靠性”成正比的量的線索傳遞給周圍,以估計標籤。結果,可以考慮來自相鄰節點的線索量(可靠性),並且可以處理具有不同標籤的節點可以容易地連接的網絡數據。實驗結果表明,該方法比目前主流方法具有更高的準確率。

 通過在常規估計過程中引入“可靠性”的概念,本研究結果使更準確的標籤估計成為可能。未來,在考慮與現實世界中大數據的合作與利用時,有望成為一種用於估計用戶屬性的創新技術。

筑波大學

持續挑戰跨學科融合與國際化,以智慧、人性化發展人力資源

筑波大學綠意盎然,是筑波科學城的核心,一座學術文化氣息濃厚的國際都市。目前的教育體係為9組23班,可開設各領域的專業入門課程,旨在培養具有創造性的智慧和豐富的人文精神。用靈魂天才解決全球問題 […]

大學學報在線編輯部

這是大學期刊的在線編輯部。
文章由對大學和教育具有高水平知識和興趣的編輯人員撰寫。