您現在的位置:海峽網>新聞中心>IT科技>科技前沿
      分享

      此前一年時間內,“靈犬”已陸續完成兩次迭代。2018年3月28日,今日頭條首次上線“靈犬”,支持檢測文字和文章鏈接。2018年5月16日,“靈犬”完成服務能力升級,增加反色情短文本模型和反謾罵模型,將準確率從73%提升至82%。2019年2月20日,“靈犬2.0”正式上線,除了反色情低俗模型,加入反暴力謾罵和反標題黨模型,覆蓋了主要的低俗低質內容類型,整體識別準確率接近85%。截至2019年6月,靈犬反低俗助手的使用人次已經超過了300萬。

      用戶只需要在“靈犬”內輸入一段文字或文章鏈接,“靈犬”就可以幫助其檢測內容健康指數,返回一個鑒定結果。對于用戶輸入的內容,“靈犬”會先進行提取、分詞和語義識別,然后根據相關規則, 輸出對應的分數、評級和結論。這一切都在短短幾秒內完成。圖片和圖片鏈接檢測同理,用戶在“靈犬”內上傳圖片或圖片鏈接,即可快速獲取鑒定結果。

      “靈犬”背后的技術迭代

      據王長虎介紹,“靈犬”背后的文本分類模型,已經經過了三次迭代。每個新版本相對于舊版本,在技術和數據集層面,都有一個明顯的躍升。

      第一代“靈犬”,應用的是“詞向量”和“CNN(卷積神經網絡)”技術,訓練數據集包含350萬數據樣本,對隨機樣本的預測準確率達到79%。第二代“靈犬”,應用的是“LSTM(長短期記憶)”和“Attention”技術,訓練數據集包含840萬數據樣本,準確率提升至85%。

      新版“靈犬”同時應用了“Bert”和半監督技術,并且在此基礎上使用了專門的中文語料,在不犧牲效果的情況調整了模型結構,使得計算效率能達到實用水平。“Bert”是當前最先進的自然語言處理技術,是該領域近年來重大進展的集大成者。這項技術在常見的閱讀理解、語義蘊含、問答、相關性等各項任務上,大幅提高了性能。

      這一代“靈犬”訓練數據集總量是1.2個T,相當于20倍百度百科或100倍維基百科的數據總量,包含920萬個樣本,準確率提升至91%。

      不同于文本識別,圖片識別的技術難點主要在于三方面:非均衡、類內方差大和不可窮舉,即,低俗圖片占整體圖片內容的比例較低,低俗圖片的種類豐富、繁雜,構成低俗圖片的特征千差萬別。

      對此,“靈犬”運用的解決方案,是深度學習。“我們分別在數據、模型、計算力等方面做了很多優化。”王長虎說。數據層面,“靈犬”已累積上千萬級別的訓練數據。模型層面,“靈犬”針對許多困難樣本做了模型結構調優,嘗試解決多尺寸、多尺度、小目標等復雜問題。計算力層面,“靈犬”利用分布式訓練算法以及GPU訓練集群,加速模型的訓練和調試。

      一些技術難以搞定的問題,現階段還有賴于人工判斷。比如技術暫時難以制定標準的案例:世界名畫中常常出現裸體女子,如果完全交由機器判斷,機器通過識別畫中人物的皮膚裸露面積,就會認為這幅畫是色情低俗的;而某些拍攝芭蕾舞的圖片,以機器的視角來看,其實類似于裙底偷拍。

      此外是因為使用場景、人群不同而導致標準變動的案例:內衣和內衣模特出現在購物平臺上,會被默認為正常,但如果頻繁出現在新聞資訊平臺上,就可能被認為有低俗嫌疑;正常的熱舞內容,提供給成年人看,符合常規標準,但如果開啟了青少年模式,這些內容就不應該出現。

      王長虎說,針對低俗判斷問題的復雜性和不同判斷方式的局限性,一方面需要不斷進化技術模型,一方面需要有效結合技術和人工判斷兩種方式。

      當前,“靈犬”建設了比較完善的模型迭代系統。通過“數據收集—數據標注—數據清洗—模型訓練—模型評估—badcase分析”這一套完整的流程,持續做優化。

      責任編輯:楊林宇

             特別聲明:本網登載內容出于更直觀傳遞信息之目的。該內容版權歸原作者所有,并不代表本網贊同其觀點和對其真實性負責。如該內容涉及任何第三方合法權利,請及時與ts@hxnews.com聯系或者請點擊右側投訴按鈕,我們會及時反饋并處理完畢。

      最新科技前沿 頻道推薦
      進入新聞頻道新聞推薦
      情聚八閩,共啟新程!福建省姓氏源流研
      進入圖片頻道最新圖文
      進入視頻頻道最新視頻
      一周熱點新聞
      下載海湃客戶端
      關注海峽網微信
      ?

      職業道德監督、違法和不良信息舉報電話:0591-87095414 舉報郵箱:service@hxnews.com

      本站游戲頻道作品版權歸作者所有,如果侵犯了您的版權,請聯系我們,本站將在3個工作日內刪除。

      溫馨提示:抵制不良游戲,拒絕盜版游戲,注意自我保護,謹防受騙上當,適度游戲益腦,沉迷游戲傷身,合理安排時間,享受健康生活。

      CopyRight ?2016 海峽網(福建日報主管主辦) 版權所有 閩ICP備15008128號-2 閩互聯網新聞信息服務備案編號:20070802號

      福建日報報業集團擁有海峽都市報(海峽網)采編人員所創作作品之版權,未經報業集團書面授權,不得轉載、摘編或以其他方式使用和傳播。

      版權說明| 海峽網全媒體廣告價| 聯系我們| 法律顧問| 舉報投訴| 海峽網跟帖評論自律管理承諾書

      友情鏈接:新聞頻道?| 福建頻道?| 新聞聚合
      国产精品亚洲小说专区| 亚洲日韩精品国产一区二区三区| 亚洲人成人网毛片在线播放| 久久精品国产亚洲AV电影| 国产成人亚洲综合无码精品| 在线观看国产区亚洲一区成人| 亚洲成年看片在线观看| 亚洲av乱码中文一区二区三区| 亚洲AV无码无限在线观看不卡| 亚洲av无码国产综合专区| 亚洲自偷自拍另类图片二区| 亚洲卡一卡2卡三卡4卡无卡三| 亚洲精品夜夜夜妓女网| 亚洲精品夜夜夜妓女网| 亚洲国产另类久久久精品小说 | 久久久久亚洲av无码专区喷水 | 亚洲免费综合色在线视频| 亚洲熟妇成人精品一区| 33333在线亚洲| 亚洲已满18点击进入在线观看| 亚洲噜噜噜噜噜影院在线播放| 亚洲一区二区三区在线观看蜜桃| 亚洲制服丝袜精品久久| 亚洲综合色7777情网站777| 亚洲娇小性色xxxx| 亚洲精品123区在线观看| 亚洲 欧洲 自拍 另类 校园| 亚洲一本一道一区二区三区| 亚洲熟妇AV日韩熟妇在线| 亚洲精品成a人在线观看☆| 亚洲国产成人手机在线观看| MM1313亚洲国产精品| 亚洲Av无码乱码在线播放| 亚洲乱码中文字幕综合234| 国内精品99亚洲免费高清| 久久精品国产亚洲一区二区| 亚洲色图在线观看| 亚洲伊人久久大香线蕉在观| 亚洲熟妇成人精品一区| 亚洲äv永久无码精品天堂久久| 无码专区一va亚洲v专区在线 |