融合注意力機制和Child-Sum Tree-LSTM的二進制代碼相似性檢測 | |
所屬分類:技術論文 | |
上傳者: | |
文檔大小:981 K | |
標簽: 二進制代碼 相似性檢測 注意力機制 | |
所需積分:0分積分不夠怎么辦? | |
文檔介紹:抽象語法樹是一種代碼的樹型表示,它保留了代碼中定義良好的語句組件、語句的顯式順序和執行邏輯。包含豐富語義信息的抽象語法樹可以在二進制分析時通過反編譯生成,并且已經作為代碼特征應用于二進制代碼相似度檢測。抽象語法樹中不同類別的節點承載著不同的語義信息,對整棵樹的語義具有不同的貢獻程度。然而現有的二進制代碼相似度檢測方法所用神經網絡無法對抽象語法樹節點進行重要性區分,影響了模型的訓練效果。針對該問題,提出了一種融合注意力機制和Child-Sum Tree-LSTM神經網絡的跨指令集、跨代碼混淆二進制代碼相似性檢測方法。首先使用二進制分析工具IDA Pro對二進制代碼反編譯提取架構無關的抽象語法樹特征,并利用隨機采樣構造訓練樣本對。然后使用抽象語法樹訓練樣本對訓練融合注意力機制和Child-Sum Tree-LSTM的神經網絡模型。在公開數據集BINKIT上的實驗表明,所提方法的AUC和Accuracy指標分別為94.1%、66.2%,優于Child-Sum Tree-LSTM算法。 | |
現在下載 | |
VIP會員,AET專家下載不扣分;重復下載不扣分,本人上傳資源不扣分。 |
Copyright ? 2005-2024 華北計算機系統工程研究所版權所有 京ICP備10017138號-2