一直以來,輝瑞制藥有限公司的全球藥物科學部門都負責決定什么樣的新藥能夠進入市場,然而曾經有一段時間,該部門卻走到了技術的十字路口,難以決策。研究者們渴望著一種迭代方法,但是一旦到了需要從不同數據源集成數據的時候,這些工具變得不夠靈活,工作進度隨之不可避免地慢了下來。
過去,公司一直在使用最常用的一種集成實踐——ETL。當數據集成請求提出,ETL工具會進入數據庫或其他數據源,復制請求數據集,將其轉換成為數據集市,供用戶和應用程序獲取。
但這樣工作還沒有完成。輝瑞負責處理數據集成請求的業務信息系統(BIS)部門必須從內部客戶收集具體的需求,在繼續實施ETL流程之前將數據清單完全審核一遍。
公司BIS團隊負責人Michael Linhares說道:“當時,我們基本上都在按照這個數據倉庫信息工廠的模式走。”
由于ETL工具機械地對數據進行復制和遷移,請求容易重復并出錯。絕大部分獲取的數據都被導入Excel表格,隨后這些信息會被遷移到數據集市,與原來相比已經產生了變化。
除此之外,ETL工具都是批量處理,因此集成請求十分耗時。Linhares表示,一個項目耗時達到一年、花費超過一百萬美元都是有可能的,甚至有時候完成ETL任務時,該項目已經沒有用處了。
“這就代表它太慢了。”
若撇開成本、質量和時間不談,并不是每一個數據集成請求都值得這樣巨大的投入。很多時候研究者想要很快就能得到答案,驗證一下想法,如果不行就丟掉,然后轉移到下一個上面。但是ETL工具的工作模式非常死板,一旦完成一個集成請求,就沒有辦法緊接著添加另一項并導入新的數據源。如果必須要將新的數據源添加到數據集市,就只能再創建一個ETL。
走進數據虛擬化
對于更多靈敏性的需求,外加預算縮減的壓力,促使Linhares開始尋求另一種數據集成方式——數據虛擬化。這一技術不是簡單地復制和遷移數據,而是在保留原有工具的同時,從多種源數據中提取數據,并通過一個門戶網站為用戶創造出一個虛擬視角,無論數據是在平面文件、Oracle數據庫還是SQL Server中,都能夠讓用戶迅速地查詢與分享,還有最重要的——集成。
Linhares的團隊在2005年選擇了Composite軟件公司剛推出的數據集成平臺。Forrester稱,自2005年以來,企業持續添加諸如基于云的CRM系統和BI工具等更多的數據源,數據管理和集成需求也隨之增長。
在Forrester 2011年發布的《Data Virtualization Reaches Critical Mass》報告中,我們看到,“數據虛擬化在新的性能和客戶成功案例驅動下,以策略性的解決方案,展現出IaaS的一片大好前景,同時向企業數據管理邁進了一大步。”
報告指出,與數據合并這樣的傳統數據集成方法相比,數據虛擬化相對來講還是比較省錢的。
而Composite由于推出了滿足幾項重要標準的易于使用的產品,被Forrester列為2012年市場中數據虛擬化的領導者。Linhares表示,這一新的平臺能夠緩存數據,即便服務器崩潰,用戶仍然可以看到記憶數據;另外,它還支持標準編程語言“pure SQL”。
Linhares在過去的采訪中多次提到,企業在實施數據虛擬化之前必須做好面對第一關挑戰的心理準備,即必須確保在所有數據源中對授權數據進行及時處理與統一定義;否則的話,數據虛擬化將收不到成效。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://m.lukmueng.com/
本文標題:輝瑞制藥摒棄ETL走進數據虛擬化