在電信行業(yè),運營商構(gòu)建了非常多的應(yīng)用系統(tǒng)為廣大消費者提供各種特色服務(wù),有一些系統(tǒng)的功能由于在業(yè)務(wù)操作的上下文中,涉及到多個業(yè)務(wù)系統(tǒng)的子功能,需要多個系統(tǒng)共同提供服務(wù)才能正常工作,導(dǎo)致任何系統(tǒng)出現(xiàn)異常都會影響到其余的系統(tǒng),對企業(yè)形象和社會造成非常惡劣的影響。
而各業(yè)務(wù)系統(tǒng)的應(yīng)用日志是了解業(yè)務(wù)系統(tǒng)是否正常運行的最直接可靠的窗口,通過統(tǒng)一收集、分類應(yīng)用日志,并實現(xiàn)日志分析,可實現(xiàn)如下價值:
-
加強網(wǎng)絡(luò)運營效率:收集各類設(shè)備和應(yīng)用的關(guān)聯(lián)行為,分析網(wǎng)絡(luò)通信服務(wù)質(zhì)量,實現(xiàn)系統(tǒng)運維監(jiān)控,提升網(wǎng)絡(luò)工作效率,改善客戶使用體驗。
-
合理配置渠道資源:針對不同類型與喜好特點的客戶群體,按渠道投放差異化的產(chǎn)品和服務(wù),提高渠道利用效率。
-
客戶畫像與精確營銷:記錄客戶在各種渠道的行為和接觸信息,預(yù)測客戶行為動機,從而準確地推送個性化的服務(wù)和產(chǎn)品。
因此,電信運營商對于應(yīng)用日志的監(jiān)控力度非常大,一旦出現(xiàn)異常信號,需要及時通知操作人員進行問題定位與問題解決。但這種方式只能進行問題的事后補救處理,不能預(yù)先發(fā)現(xiàn)應(yīng)用系統(tǒng)的隱藏問題。而且由于日志數(shù)據(jù)是典型的文本類半結(jié)構(gòu)化大數(shù)據(jù),傳統(tǒng)的關(guān)系型數(shù)據(jù)庫無法滿足海量日志數(shù)據(jù)的存儲與實時查詢分析需求。
1.用戶業(yè)務(wù)需求
-
業(yè)務(wù)問題溯源查詢,響應(yīng)時間3秒內(nèi)
-
多維度分析結(jié)果的聚集與實時展現(xiàn)
2.業(yè)務(wù)與技術(shù)挑戰(zhàn)
原解決方案
如下圖所示,用戶在項目初期基于Hadoop HDFS及Greenplum構(gòu)建日志監(jiān)控系統(tǒng),并將原始日志文件保存在NAS文件系統(tǒng)中。
然后通過流處理引擎將日志中的每個交易號對應(yīng)的日志報文對應(yīng)文件的偏移記錄(位置)轉(zhuǎn)換成一個格式化記錄,并將生成的數(shù)據(jù)保存在 GP(Greenplum) 中。
用戶如果希望查詢某個交易號的明細日志,需要先到GP 庫中查找這個交易號對應(yīng)在哪個文件中,并且知道了它在文件的偏移情況,打開文件,跳轉(zhuǎn)到對應(yīng)的偏移上,才能看在完整的明細日志。
原方案存在問題與不足如下:
-
當(dāng)應(yīng)用日志數(shù)據(jù)量越來越大時,流處理引擎、GP 和NAS 的管理會越加復(fù)雜、困難。
-
將日志存放在NAS 的方法,Hadoop分布式計算框架很難與其整合,無法使用簡單工具(如Hive等)進行日志分析。
3.解決方案
用戶基于SequoiaDB數(shù)據(jù)庫+Hadoop框架重構(gòu)了智能日志分析系統(tǒng),在已有日志監(jiān)控系統(tǒng)基礎(chǔ)上增加智能日志分析功能,可自動根據(jù)應(yīng)用日志分析錯誤隱患,提高應(yīng)用的糾錯能力。
如上圖所示,數(shù)據(jù)采集端將新增數(shù)據(jù)實時加載到SequoiaDB數(shù)據(jù)庫集群中,系統(tǒng)定時觸發(fā)程序每隔5分鐘啟動Hadoop MapReduce分析程序,分析結(jié)果通過GP進行多維分析查詢展現(xiàn),當(dāng)系統(tǒng)出現(xiàn)操作異常或者是用戶違規(guī)操作時,立刻通過進行系統(tǒng)操作告警。業(yè)務(wù)人員用戶可在Web操作界面通過SQL接口實時查詢應(yīng)用日志,實現(xiàn)對錯誤信息的實時定位。
在此系統(tǒng)架構(gòu)中,SequoiaDB巨杉數(shù)據(jù)庫發(fā)揮三大作用:
-
海量應(yīng)用日志的數(shù)據(jù)存儲:大量的原始日志保存到SequoiaDB數(shù)據(jù)庫中,并按時間、交易號兩個字段均勻的分布到五個節(jié)點服務(wù)器的各自數(shù)據(jù)磁盤中。由于SequoiaDB數(shù)據(jù)庫原生就支持數(shù)據(jù)備份功能,保證數(shù)據(jù)安全的同時,解決了數(shù)據(jù)災(zāi)備問題。
-
向Hadoop提供分析的原始數(shù)據(jù):SequoiaDB數(shù)據(jù)庫能與Hadoop深度整合, MapReduce程序能無縫對接SequoiaDB數(shù)據(jù)源進行高效的迭代計算,也可以通過Hive SQL對分布的日志數(shù)據(jù)進行檢索,完成并行分布式計算。
-
實時SQL查詢:用戶在查詢某個交易號的明細日志,只需以SQL形式提交相應(yīng)的交易號,SequoiaDB數(shù)據(jù)庫即按索引機制進行索引匹配,實時反饋出完整的日志報文,實現(xiàn)基于交易號的實時查詢,將處理流程大大簡化。
4.項目成果
智能運維監(jiān)控
系統(tǒng)很好地滿足了對應(yīng)用日志數(shù)據(jù)的實時統(tǒng)計及異常檢測的功能需求。
實時統(tǒng)計
異常檢測
運維簡單方便
相比起單純的HDFS文件系統(tǒng),SequoiaDB數(shù)據(jù)庫在實現(xiàn)了對應(yīng)用日志數(shù)據(jù)的集中統(tǒng)一存儲的同時,滿足了全量日志實時SQL查詢及向分析程序輸送數(shù)據(jù)的需求。
相比于引入HBase,Impala, Storm, Pig等框架的方法,基于SequoiaDB數(shù)據(jù)庫的方案運維簡單,開發(fā)方便,管理快捷,功能完善。
核心關(guān)注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://m.lukmueng.com/
本文標題:巨杉案例:基于日志的大數(shù)據(jù)運維管理平臺
本文網(wǎng)址:http://m.lukmueng.com/html/solutions/14019320041.html