現在幾乎所有的人都在說大數據,但他們的觀點大多停留在客戶行為分析的層面,事實上大數據分析包括很多層面。與此同時也有很多人在談商務智能。那大數據和商務智能到底該如何區別?實際上我不是大數據的專家,我這些年一直從事的只有一件東西:那就是商務智能。因此今天將主要圍繞大數據和商務智能展開。今天的演講分為三個部分:大數據的發展演化、從技術的角度看大數據以及從應用的角度看大數據。
首先看大數據的發展演化。如今很多人將大數據和商務智能兩個概念融合在一起談論,那大數據和商務智能化如何區別?在原來做數據分析時,我堅持從數據到信息,從信息到知識,從知識到決策,決策最后給企業帶來盈利。那這和大數據有何區別?原來講的商務智能的數據分析很多是結構化的數據分析,而現在的大數據增加了很多非結構化的模型。那什么是非結構化數據?音頻、視頻、圖像等都是非結構化數據。
今天大家都在談大數據分析什么,數據發掘都在分析什么?當年我認為數據挖掘才是真正的科學,但現在我覺得不完全是這樣。假設沒有生產數據的,哪來數據分析?現在手機天天生產數據,按照大眾普遍的觀點,所有的大數據基本都來自網絡,來自微信、ebay等平臺。那難道全球這么多企業所生產的數據都不叫大數據嗎?因此我現在認為大數據就是數據到信息,從信息到知識,從知識到決策,決策最后給企業帶來盈利。這才是數據分析。
與傳統分析不同,大數據分析是基于大量的非結構化數據,數據來源包括內部數據和外部數據。大數據從大量的復雜數據中獲得信息,從大量互聯網和移動華聯、電子商務中是永恒多點,對實時數據進行分析和預測。實際上大數據一定要用起來。
以一部手機為例,如果這部手機可以知道我現在的體溫,心率,腦電圖等等我的相關身體數據,一旦這些數據被傳送到醫院,那么醫院就可以充分掌握的我數據。醫院如果要在大數據時代有所創新,就一定要從客戶的角度出發。原來的根據現有數據進行調查的模式是通過邏輯思維來實現,但現在要創新思維,創新思維要求醫院要提前知道病人在想什么,了解病人的身體情況。在我們也并不清楚自己已生病且不在醫院的情況,醫院事先知道我們生病,然后根據GPS定位掌握我們所處的位置,利用全國統一的醫療系統為我們服務。這才是未來大數據在實際應用時應有的模式。我們原來的穿戴產品都是依靠數據功能,這些數據都是模擬數據。大數據的應用到底是只做數據分析還是有更多的應用,這個問題值得我們深思。現在所有的東西都連接在一起,所有的企業也被連接在一起。所有的東西都已經是分不開的。
做了這么多年的商務智能,我對此有一些自己的看法。在2013年,商務智能在全球的需求要比大數據需求大一些。當然未來大數據的需求會越來越大。原來并不是沒有人在做大數據,只不過是因為各種原因而限制大數據的發展,比如說速度問題,設備問題等,但現在設備和應用的升級使大數據越來越普及。大數據的流行是因為業務的應用推動了其發展,而不是因為大數據而大數據。
我們現在在勘探的過程中得到了很多的數據,利用掌握的大數據找到石油資源,這就是大數據分析。媒體和娛樂、政府使用、生命科學、石油天然氣以及企業等行業的關鍵應用都推動了大數據的發展。現在很多企業都是做數據的聚類分析,但是數據的優化是特別重要的一塊,然而做的人卻不是很多。
大數據面臨著兩個問題。
一、大數據如何存儲?我剛上大學的時候,計算機的存儲量還很有限,但現在以日新月異。從技術的角度來看,大數據有以下幾個發展趨勢:
1.存儲模式的變化——內存計算;
2.虛擬系統服務——云計算;
3.終端的普及和創新——移動計算。
現在我們說三個計算:云計算、移動計算和內存計算。目前SAP做的就是把數據庫搬到內存里,然后整理出數據庫。這是一個革命性的變化。很多人會問安全問題怎么辦?實際上這并不需要擔心。大數據和移動緊密聯系在一起,大數據無論對企業還是個人都影響深遠,不管企業還是個人,每天都和大數據產生千絲萬縷的關系。
4.網絡共享的革新——物聯網。如今的大數據已和物聯網連接在一起。最近有很多的企業都在做大數據的研究,但這些公司大部分還停留在互聯網用戶數據處理的層面。所有的大公司在存取貨物時都需要考慮如何讓取貨,取什么貨,在哪取貨,取多少貨的問題,這些信息存儲下來難道不是大數據嗎?所以我認為在大數據不僅是一個分析,它還在于數據的生成和數據挖掘。
5.數據處理模式的變化——數據挖掘。現在數據挖掘越來越重要,圖像識別、音頻識別、視頻識別這些都是非常核心的應用,當然現在有越來越多的企業去研究,這是未來一個非常好的大方向。
大數據面臨的第二個問題:我們現在如何使用大數據?從應用的角度看,大數據有以下7個發展模式:
1.從主題分析到專題分析——宏觀分析到微觀分析。原來的商務智能是做主題分析,現在的商務智能則主要集中在專題分析,在專題分析中,我們通過大量的數據分析,建立分析預測模型,實現實時營銷、戰略制定的深層次細致分析。
2.從決策支持到實時操作智能——支持操作型商務智能和社區媒體協同。當下實時數據庫更加符合行業的發展需要。因此SAP強調實時數據庫。國內無論是華為還是聯通做的大數據應用都是圍繞實時數據庫開展。
3.從決策層使用到全員使用——商務智能平民化。從公司管理到經營管理再到成員企業,這是一個商務智能平民化的過程。為企業做的應用核心是解決問題。
4.從商務智能工具到商務分析應用——拿來即用的分析應用。
5.從結構化數據分析到非結構化數據分析——各種人工智能應用:智能地球、智能城市、智能交通等。這些人工智能應用SAP都有涉及,在全球應用也比較多,在美國使用情況非常好。
6.從開發工具到自助服務——易用性領跑大數據的未來。以工具來講,工具都是以簡單為主,因為沒有人會希望用復雜的東西作分析。SAP這兩年所開發的工具集中在非結構化數據分析。
7.從決策支持系統到日常應用系統——每個部門日常時刻離不開的應用系統。實際上大數據使得每個人,每一天,每一刻都分不開。
這里我要強調一點,支持互聯網與企業的運營、采購、銷售數據連在一起。大數據有四個來源:一來自企業,二來自供應商,三來自客戶,四來自外部,所以企業的數據是大數據來源非常重要的一部分。
我已經拐了一個大彎去做商務分析,更多的是做商務創新,只不過是因為創新才和大數據連在一起。但大數據將來必然是云時代創新的重要方向,希望有越來越多的年輕人能在大數據領域繼續深耕細作。