數(shù)據(jù)中心最新文章

基于預(yù)訓(xùn)練模型的基層治理敏感實(shí)體識(shí)別方法

基層治理產(chǎn)生的大量敏感數(shù)據(jù)可通過(guò)數(shù)據(jù)脫敏去除隱私內(nèi)容,但這些數(shù)據(jù)包含較多非結(jié)構(gòu)化文本數(shù)據(jù),難以直接進(jìn)行數(shù)據(jù)脫敏。因此,需要對(duì)非結(jié)構(gòu)化文本數(shù)據(jù)進(jìn)行命名實(shí)體識(shí)別以提取敏感數(shù)據(jù)。首先把敏感實(shí)體分為16類并對(duì)信訪文本進(jìn)行標(biāo)注,輸入層表示采用預(yù)訓(xùn)練模型BERT,編碼層利用雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)汲取上下文信息,解碼層通過(guò)條件隨機(jī)場(chǎng)模型優(yōu)化序列,構(gòu)建了較高精度的基層治理敏感實(shí)體識(shí)別模型。針對(duì)脫敏工作需要,改變假陰性和假陽(yáng)性的loss權(quán)重,并采用敏感實(shí)體框選率輔助評(píng)價(jià)模型性能。在基層治理信訪數(shù)據(jù)集和公共數(shù)據(jù)集MSRA上進(jìn)行實(shí)驗(yàn),F(xiàn)1值分別為88.38%和90.11%,相較于基準(zhǔn)模型提升了4.64%和3.78%。該模型可應(yīng)用于非結(jié)構(gòu)化文本的敏感實(shí)體識(shí)別,識(shí)別成功率高。現(xiàn)有評(píng)價(jià)指標(biāo)未能較好地反映敏感實(shí)體的間接推理關(guān)系,應(yīng)當(dāng)探索更完善的敏感實(shí)體評(píng)價(jià)體系。

發(fā)表于:9/25/2023

主站蜘蛛池模板: 手机在线亚洲 | 毛片在线不卡 | 欧美一级片网站 | 成人看的一级毛片 | 成人欧美视频在线观看播放 | 午夜男人女人爽爽爽视频 | 国产a级高清版毛片 | 欧美视频亚洲 | 亚洲欧洲国产成人综合一本 | 国内精品久久久久影院网站 | 男人天堂视频在线 | 中文字幕一区日韩在线视频 | 男女无遮挡拍拍拍免费1000 | 国产综合在线观看视频 | 亚洲精品国产综合一线久久 | 国产真真人女人特级毛片 | 亚洲视频区 | 精品国产综合区久久久久久 | 亚洲一区 中文字幕 久久 | 荡女妇边被c边呻吟久久 | 色网址在线观看 | 久久久亚洲欧洲日产国码二区 | 欧美激情视频在线观看一区二区三区 | 亚洲综合日本 | 在线高清免费爱做网 | 玖玖精品 | 日韩精品a在线视频 | 欧美精品做人一级爱免费 | 日韩一区二区久久久久久 | 亚洲综合第一欧美日韩中文 | 欧美精品在线视频 | 日本网址在线观看 | 一区二区三区亚洲视频 | 欧美成人极品怡红院tv | 国产精品短视频免费观看 | 九九九九热精品免费视频 | 欧美片欧美日韩国产综合片 | 成人国内精品久久久久影院 | 成人免费毛片一区二区三区 | 午夜在线观看视频免费 成人 | 男人天堂视频网站 |