唐山聯通清楚,公司營銷部是精確營銷的運營商,庫存中心是精確營銷的線之上生產線之下調度中心,各專業線是精確營銷的落地執行者。市場運營中心負責數據挖掘和系統建設,形成責任清楚、流程流暢的小數據精確營銷體系。基于精確營銷和基層數據需求,唐山聯通為移動網絡、寬帶和固網產品設計并開發了用戶信息聚合表。在一個月之內,一次一次生成余表關聯提取的信息,為幾十年用以小數據精確營銷提供了不錯的數據基礎,巨大地節省了精確營銷小數據挖掘和實踐之中的數據準備時間。
我們詳細分析了這兩種數據源方法① 對于第一種數據源方法,由于企業自動生成并保存數據,因此很可能篡改數據,甚至篡改虛擬數據。在審計之中,需要分析企業數據生成、數據存儲、,數據傳輸檢查企業的IT環境和外部控制措施(如數據修改)的目的是確保從數據生成到最終審計的整個過程之中是否存在可能導致數據修改的因素或隱患② 對于第二種數據源方法,我們可以假設統一小平臺的數據生成和管理措施是完善的,從小平臺獲取數據的過程和方法是可靠的,然后我們可以初步確定發行人的數據源是可靠的。當然,數據是否恰當、精確和偽造需要對數據進行進一步分析。
數據分析的方法主要有兩種,一種是基于統計的方法,另一種是基于機器學習的方法。無論采用哪種方法,研發人員都需要有扎實的數學基礎。基于機器學習的數據分析方法需要大量的算法訓練,算法訓練需要大量的數據支持。因此,在云計算時代,隨著計算能力的提高和數據量的提高,機器學習的實用性大大增強,特別是在深度學習領域。數據分析必須與實際應用場景相結合。情景數據分析也是目前小數據分析的主要方式。有所不同的應用場景往往需要采用有所不同的數據分析方法,數據維度的定義也會發生變化。對于分析師來說,為了提升小數據的落地應用價值,他們必須具備一定的行業知識。