數據中心最新文章 基于Hadoop的小文件量化方法研究 Hadoop[1]是一個具有高擴展性、高可靠性、高容錯性和高效性的開源軟件系統,它已成為互聯網、金融、生物信息學等領域進行大數據分析和處理的代表性云計算平臺。它由Hadoop Distributed File System(HDFS)[2]和MapReduce[3]兩部分組成,其中,MapReduce主要用來處理數據密集型數據,而HDFS則主要負責大數據的存儲。 發表于:5/25/2015 高職學生綜合技能評估系統的設計與開發 結合高職院校職業技能的評估情況,利用流行的網絡開發技術,應用改進的決策樹ID3算法和XML技術,設計并實現了高職學生綜合技能評估系統,為高職教學提供可行的數據和決策支持。 發表于:5/24/2015 LPC與LSF系數轉換的FPGA實現 首先根據切比雪夫多項式求根法對LPC系數到LSF系數轉換過程進行分析與推導,并給出了根據已知的LSF系數進行逆推求LPC系數迭代算法。然后,借助DDS算法原理實現查找表搜索求根,并在FPGA上實現了LSF系數到LPC系數轉換。最后,給出了結論和分析。 發表于:5/21/2015 基于數據挖掘的呼叫中心IVR客戶細分研究 語音應答業務利用率低、人力需求成本高是一大問題,對此,結合案例,運用CRISP-DW方法,采用Clementine工具對所得數據進行分析處理,得到IVR客戶與地區分布、ARPU值和入網時長的關系;對IVR客戶進行聚類分析,總結出其重要特點;提出相應對策,幫助提高IVR客戶的滿意度和利用率。建立一個C5.0決策樹模型,分析預測客戶是基于什么情況才進入IVR系統的。分析IVR客戶與入網時長、地區、ARPU值之間的規則,有助于更準確地了解IVR客戶并對其細分。 發表于:5/18/2015 一種基于文件預測的分布式緩存模型 在分布式存儲中,客戶端的數據訪問請求并非完全隨機,它是由程序或者用戶的行為驅動,因此文件訪問順序是可以預測的;服務器端收到的訪問請求在時間軸上也非平坦分布,因此服務器有時繁忙有時空閑。為此,提出了一種基于文件預測的分布式緩存模型,在客戶端預測將要訪問的文件,并利用服務器空閑時間傳輸預測文件。 發表于:5/18/2015 LabVIEW中調用MATLAB進行信號處理方法研究 系統是由若干互相有著某種聯系的單元組成的一個能夠完成某種功能的整體。信號作用于某系統的響應如何,需要以某種方式去分析。系統分析需要經過3個過程:(1)建模,以理論為基礎,對所要研究的對象創建一個數學模型;(2)分析該模型;(3)做出合理的物理解釋。分析過程很關鍵,方式方法很多,工具也很多,MATLAB和LabVIEW是常用的兩個軟件分析平臺。 發表于:5/13/2015 持續投入成就100億 華為“雙驅”戰略在路上 在如今的全球通信行業,華為已經站到了頂峰。在搶占了許多跨國巨頭的市場份額之后,那些跨國巨頭曾經面臨的壓力也落在了華為的身上,畢竟通信設備市場需求不振不是短時間內能扭轉的。不過這家在外界看來過于嚴謹、的技術型公司,沒有因此冒出“高處不勝寒”之類的感慨,而是主動轉向“服務”要增長,致力于搭建“產品”與“服務”雙動力的發展模式。 發表于:5/13/2015 基于數據庫的大量電子表格的自動填寫 制作填寫電子表格在今天已是一項非常常見的工作了。很多時候,都需要將手頭的數據統計匯總填寫成表格樣式以供閱讀和報告。為了完成復雜一些的功能,需要在電子表格中嵌入公式和程序代碼,以減少人工的工作量,并減少錯誤的發生,提高工作效率[1-2]。鑒于Microsoft Excel電子表格軟件的強大功能,它基本成為電子表格的代名詞,因此,以下主要以Excel為例進行討論。 發表于:5/11/2015 基于Web GIS技術的交通流量分析系統 隨著中國城市化進程的加速,城市規模的不斷擴大以及城市車輛的不斷增加,導致道路負荷日益加重,城市交通擁堵情況越來越嚴重。這種現象不僅制約了社會發展的速度,而且給城市的建設者、管理者提出了一系列的難題[1-3]。為解決這一難題,交通流量分析系統應運而生,隨著現代科技的發展,該系統在智能交通系統(ITS)領域占了很重要的部分。但是目前我國公路交通流量分析工作比較薄弱,所提供的交通流量信息無法滿足公路管理的需求,在新的外界環境下,如何進一步利用現有的新技術,使得交通流量分析系統更好地服務于交通運輸安全及環境,已經成為交通信息化討論的一個熱點問題。 發表于:5/11/2015 科技公司如何利用數據讓用戶習慣成癮? GSN Games 是一家移動游戲公司,開發撲克和賓果 (bingo) 一類的游戲產品。這家公司每天能夠從玩家正在使用的手機和平板電腦中搜集數十億數字信號——一切信息應有盡有,玩家的游戲時間、游戲類型,甚至是他們面對游戲失敗的反應。如果兩個用戶在同型號的手機上下載了同樣一款游戲,僅僅在五分鐘之內,他們各自所玩的游戲就會開始變得不同——每個游戲都會自己調整,以適應玩家的風格。 發表于:5/11/2015 基于特征聚類集成技術的組特征選擇方法 特征選擇[1]指從一組特征中挑選出一些最有效的特征以達到降低特征空間維數的目的的過程,是模式識別和機器學習領域中一項必不可少的技術,在數據預處理中發揮重要作用,它廣泛應用于文本分類、生物信息學和信息檢索等方面。尤其在海量高維數據不斷涌現的今天,許多機器學習算法受不相關和冗余特征的影響,而通過選擇合適的特征選擇算法,可以有效地去除不相關、冗余特征,加速數據挖掘的過程,提高學習算法的泛化性能和運行效率,得到更加簡單和容易理解的學習模型[2-3]。 發表于:5/10/2015 一種基于版權保護的HEVC視頻水印算法 隨著硬件條件的不斷改善,通過網絡傳輸的數據量近年來有著突飛猛進的增長,尤其是數字媒體的傳播數量。2013年1月,為了滿足人們對高清視頻的需求,視頻壓縮標準高性能視頻編碼HEVC(High Efficiency Video Coding)作為可替代H.264編碼標準的新一代國際標準被正式提出使用。HEVC是ITU-T組織和ISO/IEC組織聯合開發的視頻編碼標準,對以前的視頻格式進行了多方面的改革,其僅需H.264/AVC一半帶寬就可播放相同質量的視頻[1],因此數字視頻也將更容易被復制和修改,與此同時,數字視頻的保護問題也得到了研究者們的注意。 發表于:5/7/2015 不同拓撲結構的并行粒子群優化算法的實現 料子群優化PSO(Particle Swarm Optimization)算法最早于1995年由EBERHART博士和KENNEDY博士提出[1],由于實現容易、精度高和收斂快等優點,引起了學術界的重視,并且在實際問題的解決中展示了其優越性。 發表于:5/7/2015 基于AFOPT-tree的最大頻繁項集挖掘 1993年AGRAWAL R等人提出了一個重要的反映大規模數據中項目集之間有趣的關聯或相關聯系的研究課題[1],找出屬性間有價值的關系,即關聯規則的研究。頻繁項集的挖掘是獲取關聯規則不可或缺的步驟。但挖掘頻繁項集時需要考慮太多的候選項集。最大頻繁項集中已經隱含了所有的頻繁項集,并且在許多數據挖掘應用中也只需要挖掘最大頻繁項集,而不是獲取所有的頻繁項集,因此對最大頻繁項集的挖掘具有重大的現實意義。 發表于:5/6/2015 按事件時空聯機分析處理與可視化 研究表明,犯罪在地理時空分布并不均勻,而是表現出一定的時空聚集特性,這種聚集性常用“犯罪熱點”來表述[1]。通常犯罪現象高度集中的時段或區域就是犯罪熱點。隨著我國經濟的發展和社會的轉型,犯罪急劇增加,治安形勢日益嚴峻[2],如何有效地找到犯罪熱點,科學地配置警力資源,提高警務工作效率是一個值得研究的課題。 發表于:5/6/2015 ?…175176177178179180181182183184…?