基于預訓練模型的基層治理敏感實體識別方法
所屬分類:技術論文
上傳者:zhoubin333
文檔大小:3658 K
標簽: 預訓練語言模型 基層治理 中文命名實體識別
所需積分:0分積分不夠怎么辦?
文檔介紹:基層治理產生的大量敏感數據可通過數據脫敏去除隱私內容,但這些數據包含較多非結構化文本數據,難以直接進行數據脫敏。因此,需要對非結構化文本數據進行命名實體識別以提取敏感數據。首先把敏感實體分為16類并對信訪文本進行標注,輸入層表示采用預訓練模型BERT,編碼層利用雙向長短時記憶網絡汲取上下文信息,解碼層通過條件隨機場模型優化序列,構建了較高精度的基層治理敏感實體識別模型。針對脫敏工作需要,改變假陰性和假陽性的loss權重,并采用敏感實體框選率輔助評價模型性能。在基層治理信訪數據集和公共數據集MSRA上進行實驗,F1值分別為88.38%和90.11%,相較于基準模型提升了4.64%和3.78%。該模型可應用于非結構化文本的敏感實體識別,識別成功率高。現有評價指標未能較好地反映敏感實體的間接推理關系,應當探索更完善的敏感實體評價體系。
現在下載
VIP會員,AET專家下載不扣分;重復下載不扣分,本人上傳資源不扣分。
主站蜘蛛池模板: 影院成人区精品一区二区婷婷丽春院影视 | 国产一级一片 | 广东毛片 | 成人亚洲国产精品久久 | 日韩精品一区二区三区视频网 | 日韩在线黄色 | 国产在线观看精品一区二区三区91 | 99久久久久国产精品免费 | 免费一级a毛片在线播 | 久久aⅴ免费观看 | 亚洲欧美卡通动漫丝袜美腿 | 久久香蕉国产线看观看亚洲片 | 日韩毛片在线免费观看 | 亚洲国产精品一区二区第四页 | 99免费精品 | 特级片视频 | 免费观看日本视频 | 国产成人免费不卡在线观看 | 日本欧美不卡一区二区三区在线 | 天天夜天干天天爽 | 国产亚洲综合成人91精品 | 成人免费ā片 | 香蕉久久夜色精品国产2020 | 91精品在线国产 | 国产一级免费视频 | 欧美精品99久久久久久人 | 色a在线| 欧美毛片性视频区 | 精品丝袜国产自在线拍亚洲 | 国产成人亚洲综合无 | 亚洲欧美国产视频 | 又粗又爽又色男女乱淫播放男女 | 国产一区二区三区高清视频 | 欧美午夜性春猛交 | 成人亚洲网站 | 国产精品夫妇久久 | 黄色毛片播放 | 亚洲精品一区二区三区 | 欧美大片无尺码在线观看 | 一级a毛片免费观看久久精品 | 日韩美毛片 |