《電子技術應用》
您所在的位置:首頁 > 其他 > 設計應用 > 集成機器學習模型在不平衡樣本財務預警中的應用
集成機器學習模型在不平衡樣本財務預警中的應用
2021年電子技術應用第8期
張 露1,劉家鵬1,江敏祺2
1.中國計量大學 經濟與管理學院,浙江 杭州310018;2.上海財經大學 信息管理與工程學院,上海200000
摘要: 基于上交所主板市場A股企業的財務指標數據來預測企業的財務風險,樣本數據包括1 227家正常上市企業和42家被財務預警的企業,數據嚴重不平衡,通過重采樣技術解決了分類器在不平衡樣本中失效的問題,運用Bagging思想的集成機器學習對預測模型進行提升與優化。正確挑選出有財務危機企業的概率最高達到92.86%,在此基礎上,樣本的整體準確率在經過模型的集成之后提高了5.4%。集成模型提高了對上市企業的財務預警能力,能為企業的正常經營和投資者的安全投資提供一定的借鑒。
中圖分類號: TN99;TP391
文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.201234
中文引用格式: 張露,劉家鵬,江敏祺. 集成機器學習模型在不平衡樣本財務預警中的應用[J].電子技術應用,2021,47(8):34-38.
英文引用格式: Zhang Lu,Liu Jiapeng,Jiang Minqi. The application of the integrated machine learning model in the financial crisis of imbalanced sample[J]. Application of Electronic Technique,2021,47(8):34-38.
The application of the integrated machine learning model in the financial crisis of imbalanced sample
Zhang Lu1,Liu Jiapeng1,Jiang Minqi2
1.School of Economics and Management,China Jiliang University,Hangzhou 310018,China; 2.School of Information Management and Engineering,Shanghai University of Finance and Economics,Shanghai 200000,China
Abstract: This paper forecast the financial risk of enterprises based on the financial index data of A-share enterprises in the main board market of Shanghai Stock Exchange.The samples included 1227 normal listed enterprises and 42 enterprises which have been financial warning. The data was seriously unbalanced. The problem of classifier failure in unbalanced samples was solved by resampling technology in some certain.The integrated machine learning based on Bagging was used to improve and optimize the prediction model.The highest probability of correctly selecting enterprises with financial warning was 92.86%. On this basis, the overall accuracy of the sample was improved by 5.4% after the integration of the model. The integrated model improved the financial early warning ability of listed enterprises which could provide some reference for the normal operation of enterprises and the safety investment of investors.
Key words : financial early warning prediction;integrated machine learning;imbalanced sampling technology

0 引言

    進入大數據時代以來,對信息的敏感程度和預測能力變得尤為重要,而對企業而言,無論是在經營活動還是投資活動中,財務危機預警一直是個問題和難題。機器學習的興起為大數據的處理和應用提供了新的方式。

    目前,許多學者將機器學習與金融危機預警相結合,取得了重大突破。OHLSON J A[1]建議將邏輯回歸應用于分類的后概率,來估計公司的破產概率。Zou Hui和HASTIE T[2]提出了彈性網絡,克服了嶺回歸和Lasso的缺點[3]。決策樹學習是一種強大的分類器[4],在樹分類器的基礎上,有學者提出了隨機森林[5]和XGBoost[6],在計算機[7]、圖像分類[8]等領域被證明有效。

    但在過去的研究中,大多采用人工設定樣本量,而忽視了實際上財務預警企業與正常企業的數量對比的懸殊[9]。數據不平衡的問題是財務預警研究領域的難題[10]。VEGANZONES D和SEVERIN E[11]提出采樣技術可用于提高不平衡樣本預測的分類器性能,隨機上采樣技術[12]、隨機下采樣技術[13]和人工合成少數抽樣技術(SMOTE)[14]的應用解決了集成復雜分類器在不平衡的財務預警研究數據中失效的問題。而集成學習機制可以通過集成不同的模型來整合多種算法的優點[15],目前在個人信貸領域已經有了一定的應用[16]




本文詳細內容請下載:http://www.rjjo.cn/resource/share/2000003695



作者信息:

張  露1,劉家鵬1,江敏祺2

(1.中國計量大學 經濟與管理學院,浙江 杭州310018;2.上海財經大學 信息管理與工程學院,上海200000)




wd.jpg

此內容為AET網站原創,未經授權禁止轉載。
主站蜘蛛池模板: 51久久夜色精品国产 | 国产精品国产亚洲精品看不卡 | 久草视频在线首页 | 欧美一级免费看 | 国产日韩欧美久久久 | 欧美日韩综合精品一区二区三区 | 亚洲精品久久久久久久福利 | 欧美日韩在线视频不卡一区二区三区 | 久久er热在这里只有精品85 | 国产一区亚洲二区三区毛片 | 亚洲免费网站观看视频 | 亚洲国产精品久久综合 | 九九在线免费视频 | 一级特黄一欧美俄罗斯毛片 | 性生大片一级毛片免费观看 | 亚洲日本久久一区二区va | 国产美女一区二区三区 | 一级性毛片 | 影院成人区精品一区二区婷婷丽春院影视 | 亚洲欧美精品一区二区 | 久久精品免观看国产成人 | 色婷婷激婷婷深爱五月老司机 | 国产理伦 | 日韩中文字幕在线观看视频 | 亚洲色视频在线播放网站 | 欧美日韩一区二区三区久久 | 99久久精品免费精品国产 | 色综合久久久久久888 | 日韩欧美一及在线播放 | 亚洲爆爽| 男女国产 | 国产欧美日韩精品一区二区三区 | 免费看三级毛片 | 最新福利片v国产片 | 一区二区三区四区在线视频 | hd最新国产人妖ts视频 | 怡红院日本一道日本久久 | 八戒午夜精品视频在线观看 | 国产欧美一区二区成人影院 | 亚洲欧美成人综合久久久 | 网站国产 |