精准猎取科技资讯,天堂视频在线观看,高效阅读科技新闻_黄色av网站在线免费观看_科技猎

建模術:數據挖掘要還原用戶的生活場景

我是創始人李巖:很抱歉!給自己產品做個廣告,點擊進來看看。  

萬物皆數據,數據藏大道。教你Know那些有趣、有用、有逼格的Data!

繼續“術”篇,希望能更貼近實操。

“術”篇將包含數據收集、數據管理、建模、網站分析、個性化推薦、場景應用、數據升溫理論等,這些都是筆者擅長的領域,在長期的實踐過程中,形成了個人獨特、務實的理解和方法。

建模無疑是大數據里面最藝術的部分,也是最令大數據從業者癡迷、得意的領域,一個好的模型就是一篇作品,是一首詩,令人心曠神怡。

建模、模型并不是什么新鮮事物,它們早已出現在很多場合,譬如“產品模型”、“推薦模型”、“營銷模型”、“挖掘模型”等等,它們有什么不同?

建模的幻影有千萬種,有些人做過,有些人沒做過,我們該如何看待?

建模是不是需具備很多專業知識,非專業人士無法掌握?

小白楊的所思所想,都在下面的文字。

   一、建模并不神秘:讓數據產生新的數據

一些建模的觀點已在前面的道與法兩篇體現,歸納如下:

   建模的本質就是讓數據產生新的數據。 人類、智能體的認知、行動需要用到不同的數據(Know->行動),如果這個數據沒有被直接掌握,那就要基于已知的事實數據推測,這個過程就是“建模”,得到的結果就是一個新的“數據”。

建模術:數據挖掘要還原用戶的生活場景

   建模就是在做偵探, 都是利用已掌握的大量的、不完整的、不一定可信的事實數據推導還原事實的全部。幾乎所有的領域都涉及建模。

   模型分三大類,但萬變不離其宗。

第一類,利用已知的事實數據計算推測相關聯的其它事實數據,譬如應用人的屬性、行為數據推測它的消費需求;

第二類,利用已知的事實數據計算推測規律性的數據,譬如基于歷史的購買記錄分析商品的銷售趨勢、細分比較等;

第三類,利用已知的細節事實數據組合建立對事實全局的認識(數據),譬如從生效時間、適用區域及客戶群、定價等維度建立產品模型,其實就是綜合這些細節數據形成了一個“產品”的“數據”。

對“新”的數據的認識不要拘泥于一定要和以前的數據不一樣,多個數據組合形成新的含義也是一種新的數據。

數據是人類對世界的觀測,把客觀世界抽樣、采集到數字世界里面,建模就是要在數字世界里面把客觀事實還原回來、預測它的發展。有趣的是,在數字世界里面,可以打破客觀物質的當前認知局限,任意交叉組合,從而有無限創新的可能。

總結一下,建模本質就是對已知數據的組合、簡單或者復雜的計算處理,最終轉換成一個新的數據,從而影響行動。

不同類型建模差別很大,接下來我們將聚焦到數據營銷領域來探討,部分觀點不具備普適性。

   二、建模的六大誤區

   誤區一:會用工具等于會建模? 數據挖掘大多遵循CRISP-DM流程,弄來很多的數據維度(有甚者上百種),選取某一種算法,找來訓練集訓練出一堆莫名其妙的規則,輸出的目標用戶特征誰也說不清楚,只能告訴你支持度、置信度多少。這個過程本來是沒有問題的,前提條件是有明確的挖掘方向。但是很多人都錯把業務目標當挖掘方向了。

真正的建模應該從業務目標開始,先基于業務目標理解客戶分解挖掘方向(特征明顯的群體),再找數據用算法關聯推導。懂工具能很好的完成挖掘方向到目標結果的過程,但業務目標到挖掘方向這個過程就不是只掌握工具就能夠勝任的了。

敏銳的洞察挖掘方向、正確的數據選取是建摸的核心能力,比掌握工具更加重要!

   誤區二:建模不與實際銷售場景相結合! 某央企(莫亂猜)各省公司大數據成功案例滿天飛,模型成功率動輒30-40%。筆者看到的時候自慚形愧,也一直很納悶,做了這么多年精準營銷,大部分模型的營銷成功率都是幾個百分點,兩位數以上的鳳毛麟角,怎么別人的水平都已經趕超美帝了!后來終于搞明白,原來他們的目標客戶在各種渠道成功下單都算,不管是否施加了營銷動作,而我們只統計針對目標用戶采取營銷動作的直接轉化下單。他們得意于挖出目標用戶的精準,其實,這些模型的高成功率只能說明這批用戶自然轉化率高,找出這些用戶并無實質意義,因為不施加任何動作用戶就已經購買了,挖它出來干嘛?

建模必須與實際銷售場景結合,要么找出自然轉化率高的用戶采取更低成本的接觸方式轉化,要么找出一批用戶施加營銷動作后較自然轉化大大提升!

   誤區三:盲目使用、過度依賴訓練集! 訓練集是個雙刃劍,正確使用能充分發揮技術算法的價值,而濫用則陷入誤區。前面說的某央企案例,其實訓練那些模型并不困難,不就把各渠道成功下單用戶作為訓練集嘛,掌握工具的新手都能做出來。訓練集要與準備施加的營銷動作一致的才有意義。

訓練集還要有代表性,譬如歷史的數據是和大客戶談妥對其所有員工批量轉化的,以這些數據為訓練集就沒有任何意義。

營銷場景初始往往沒有訓練集,必須跳出“訓練集”局限。

   誤區四:要相關不要因果! 《大數據時代》作者提出這個觀點的時候,其實并不是要放棄追求因果,而是找出相關關系后,更迫切的是接下來怎么做,因果關系可以慢慢研究。這一點被很多人誤讀,世間沒有無緣無故的愛,也沒有無緣無故的恨,兩個事物相關度很高,背后必定有一串的因果鏈條,如果找不到,那可能是因為訓練集的問題導致偽相關,我們就要警惕了。

   誤區五:過于迷信算法! 大道至簡,有效的東西一定是簡單的。非要復雜,那一定是因為沒找到或者沒掌握關聯度更高的原始數據。算法并不能解決所有問題,沒有好的數據基礎,它無能為力。建模涉及到很多關鍵要素,比拼的是綜合實力,在同等條件下,努力提升算法才是有意義的。

   誤區六:盲目追求數據精度! 高的精度意味著更高的成本,對應更少的數據規模,如何取舍就要運用“法”篇說的ROI原則了。

   三、建模七術

建模術:數據挖掘要還原用戶的生活場景

   1、場景驅動

建模的第一件事情是搞清楚應用場景,提煉賣點、利益點,哪些是能打動用戶的關鍵要素。從“命中目標”和“命中營銷特性”這兩個方面去思考我們要找什么樣的用戶,匹配什么樣的關鍵特征。

   2、迭代建模

建模要用互聯網思維“小步快跑,快速迭代”,快速對消費者需求做出反應,否則數據會失去時效。因此我們應從簡單開始入手,采用簡單算法快速輸出數據,后續在實戰中不斷檢驗、修正、迭代優化,不斷提升數據的精準性。

   3、場景還原

確定業務目標后,還原用戶的生活場景,設想用戶的需求場景,再考察數據能否關聯。

理解生活,數據挖掘會很簡單。商業最終解決的是人們的物質文化需求,你想挖掘什么樣的群體,先從生活中去理解它,它在什么場景下需要這些產品,有什么行為習慣,在我們的數據中留下了哪些蛛絲馬跡?譬如“外圍女”這個群體,你too simple對她們一無所知,就很難把她們找出來。為了挖掘“工業區人群”,我們特地組織前往廠區調研他們購買手機、上網、生活習慣等情況,為了挖掘“出租車司機”,我們打車的時候對他們進行了訪談。

五個方面理解還原。

身份屬性:譬如商務精英消費能力高使用Iphone手機比例高

狀態變化:譬如夜間位置變換,推測用戶搬家了有寬帶需求

行為表達:譬如在社交網絡、搜索引擎等互聯網上表達了對目標商品的關注

習慣偏好:譬如喜歡日本料理、西餐廳的人群超60%使用Iphone手機

關系推測:譬如和快遞員交互的用戶,我們推測它是一個電商消費者

對于任何一個業務目標,都可以從上述五個方面還原與業務目標相關聯的場景,還原足夠多的場景,就可以挖掘出足夠規模的用戶數據。

   4、找數據關聯

還原出場景后,就要找數據進行關聯。有些我們可以基于直接數據進行輸出,沒有直接的數據,則找間接數據選取算法進行推導,而間接數據的選取,可繼續應用上述五個方面場景還原的方法。

至于具體如何清洗數據、缺省異常值處理、算法選取、誤差分析等等那些實操細節,文章很多。

   5、快速收斂

建模是人與機器協作的結果,核心參與者是人,建模方向由人來確定,數據維度的選取主要是人(機器輔助驗證),算法也是人設計的,機器所起的所用是訓練迭代,而機器儲存的數據相對人腦太單一,人對數據結果、應用結果進行解讀,及時輸入一些理解能加快收斂的速度。

   6、少即是多  

挖掘的目標不僅僅是“有需求”,而是“能轉化”,因為好的營銷場景、文案,能激發那些原來看起來沒有需求的用戶的購買欲望,而即使是有需求的用戶,如果不能直擊它的痛點、愉悅點,也難以轉化。

好的模型應盡量簡單,很多復雜規則的模型有可能命中率高,但實際營銷應用的時候,往往難以與營銷特性相匹配,效果不一定好;而簡單模型特征明顯,全力聚焦用戶特性策劃營銷動作,更能引起用戶共鳴,產生興趣進而購買。

   7、高質量的數據才是硬道理

正是因為我們沒有直接數據,所以我們只能找其它數據間接推導,如果我們掌握的數據與目標關聯度很高,那么算法可以很簡單,否則無論算法多么的先進,效果也是有一個瓶頸的。

與其花大力氣建模,筆者更愿意前瞻性的解決數據源問題,收集更多更有效的數據。

筆者更愿意當一個數據架構師,也一直自命數據架構師。

  最后總結一下,建模其實并不神秘,本質上是讓數據產生新的數據。而建模關鍵是要還原用戶的生活場景,找準方向,找到合適的數據關聯推導,快速校驗迭代收斂。

<完 >

作者:吳顯洋(云中白楊,也稱小白楊):從小愛數學,畢業于清華大學計算機系,曾是系統架構師,后回歸數據,10年大數據實戰經驗,擅長數據化思考、系統性設計。愛徒步、愛歷史、愛思考宇宙!信奉道家思想,堅信萬物皆數據,數據藏大道。

建模術:數據挖掘要還原用戶的生活場景

責任編輯:陳近梅

本文被轉載1次

首發媒體 數據觀 | 轉發媒體

隨意打賞

用戶數據挖掘數據挖掘
提交建議
微信掃一掃,分享給好友吧。
主站蜘蛛池模板: 上海租车公司_上海包车_奔驰租赁_上海商务租车_上海谐焕租车 | 称重传感器,测力传感器,拉压力传感器,压力变送器,扭矩传感器,南京凯基特电气有限公司 | 数显水浴恒温振荡器-分液漏斗萃取振荡器-常州市凯航仪器有限公司 | 尼龙PA610树脂,尼龙PA612树脂,尼龙PA1010树脂,透明尼龙-谷骐科技【官网】 | 楼承板设备-楼承板成型机-免浇筑楼承板机器厂家-捡来 | HYDAC过滤器,HYDAC滤芯,现货ATOS油泵,ATOS比例阀-东莞市广联自动化科技有限公司 | 密封无忧网 _ 专业的密封产品行业信息网| 搪瓷搅拌器,搪玻璃搅拌器,搪玻璃冷凝器_厂家-淄博越宏化工设备 | 酶联免疫分析仪-多管旋涡混合仪|混合器-莱普特科学仪器(北京)有限公司 | 北京租车公司_汽车/客车/班车/大巴车租赁_商务会议/展会用车/旅游大巴出租_北京桐顺创业租车公司 | 温控器生产厂家-提供温度开关/热保护器定制与批发-惠州市华恺威电子科技有限公司 | 砖机托板价格|免烧砖托板|空心砖托板厂家_山东宏升砖机托板厂 | 真空泵维修保养,普发,阿尔卡特,荏原,卡西亚玛,莱宝,爱德华干式螺杆真空泵维修-东莞比其尔真空机电设备有限公司 | 风淋室生产厂家报价_传递窗|送风口|臭氧机|FFU-山东盛之源净化设备 | 控显科技 - 工控一体机、工业显示器、工业平板电脑源头厂家 | 钢骨架轻型板_膨石轻型板_钢骨架轻型板价格_恒道新材料 | 海外整合营销-独立站营销-社交媒体运营_广州甲壳虫跨境网络服务 焊管生产线_焊管机组_轧辊模具_焊管设备_焊管设备厂家_石家庄翔昱机械 | 广州工业氧气-工业氩气-工业氮气-二氧化碳-广州市番禺区得力气体经营部 | 耳模扫描仪-定制耳机设计软件-DLP打印机-asiga打印机-fitshape「飞特西普」 | 【电子厂招聘_普工招工网_工厂招聘信息平台】-工立方打工网 | 螺纹三通快插接头-弯通快插接头-宁波舜驰气动科技有限公司 | 护腰带生产厂家_磁石_医用_热压护腰_登山护膝_背姿矫正带_保健护具_医疗护具-衡水港盛 | 伟秀电气有限公司-10kv高低压开关柜-高低压配电柜-中置柜-充气柜-欧式箱变-高压真空断路器厂家 | 微波萃取合成仪-电热消解器价格-北京安合美诚科学仪器有限公司 | 校园气象站_超声波气象站_农业气象站_雨量监测站_风途科技 | 超声骨密度仪-骨密度检测仪-经颅多普勒-tcd仪_南京科进实业有限公司 | 捆扎机_气动捆扎机_钢带捆扎机-沈阳海鹞气动钢带捆扎机公司 | 彭世修脚_修脚加盟_彭世修脚加盟_彭世足疗加盟_足疗加盟连锁_彭世修脚技术培训_彭世足疗 | 纯水电导率测定仪-万用气体检测仪-低钠测定仪-米沃奇科技(北京)有限公司www.milwaukeeinst.cn 锂辉石检测仪器,水泥成分快速分析仪-湘潭宇科分析仪器有限公司 手术室净化装修-手术室净化工程公司-华锐手术室净化厂家 | 成都亚克力制品,PVC板,双色板雕刻加工,亚克力门牌,亚克力标牌,水晶字雕刻制作-零贰捌广告 | 油罐车_加油机_加油卷盘_加油机卷盘_罐车人孔盖_各类球阀_海底阀等车用配件厂家-湖北华特专用设备有限公司 | 广州办公室设计,办公室装修,写字楼设计,办公室装修公司_德科 | 郑州宣传片拍摄-TVC广告片拍摄-微电影短视频制作-河南优柿文化传媒有限公司 | 蒸压釜_蒸养釜_蒸压釜厂家-山东鑫泰鑫智能装备有限公司 | 承插管件_不锈钢承插管件_锻钢高压管件-温州科正阀门管件有限公司 | 酵素生产厂家_酵素OEM_酵素加盟_酵素ODM_酵素原料厂家_厦门益力康 | 微型气象仪_气象传感器_防爆气象传感器-天合传感器大全 | 武汉不干胶印刷_标签设计印刷_不干胶标签印刷厂 - 武汉不干胶标签印刷厂家 | 济南网站建设_济南网站制作_济南网站设计_济南网站建设公司_富库网络旗下模易宝_模板建站 | 蒜肠网-动漫,二次元,COSPLAY,漫展以及收藏型模型,手办,玩具的新媒体.(原变形金刚变迷TF圈) | 防堵吹扫装置-防堵风压测量装置-电动操作显示器-兴洲仪器 |