基於12000個智鑽創意構建創意自動分類器
2016nianshirengongzhinengdebaofanian,errengongzhinengjiyuhailiangshuju。duiyudianshanglaishuo,zhizuantoufangzhongchanshengdaliangtoufangshuju,qizhongchuangyishujuduiyuzuanzhanxiaoguofenxilaishuoyouweizhongyao。jiyu4個月幾百個商家,合計12000張創意可以為我們對日常創意效果的判斷提供曆史支持。因此,利用深度學習來訓練出能夠自分創意的想法油然而生。
正文:
對於商家來說,日常智鑽投放中zhong有you大da量liang創chuang意yi需xu要yao替ti換huan更geng改gai,但dan是shi創chuang意yi往wang往wang改gai完wan就jiu算suan了le,它ta的de數shu據ju也ye隨sui之zhi舍she棄qi。但dan是shi冷leng靜jing一yi想xiang,究jiu竟jing對dui於yu我wo們men日ri常chang投tou放fang來lai說shuo,怎zen樣yang效xiao果guo的de創chuang意yi才cai是shi一yi張zhang值zhi得de肯ken定ding的de創chuang意yi呢ne?怎zen樣yang的de創chuang意yi數shu據ju才cai能neng代dai表biao廣guang泛fan的de商shang家jia心xin聲sheng呢ne?因yin此ci,本ben次ci項xiang目mu基ji於yu7月到11月所有投放過鑽展的商家創意數據,涵蓋超過50個類目12000張創意,構建具有廣泛代表性的創意分類模型,並從模型中找到對我們日常投放有指導意義的信息。
一、智鑽創意數據的量綱和維度
所謂的量綱指的是每張創意數據所觀察的時間範圍,本次實驗全部創意觀察的量綱統一為1個月。而初始候選觀察維度較多:
數據的搜集通過協助商家推廣的期間不斷積累下來,3個月下來數據量在1W2zuoyou。erwomenshijidangzhong,dajiadourentongzhenzhenghaodechuangyixiangduilaishijiaoshao,yinci,womentongguochangshijianzixunzhizuanguwenrenyuan,yangedibazhexieshujuzhongzhenzhengbijiaohaodechuangyitiaoxuanchulai,qitalieweiyibandechuangyishuju。zhenggeshiyanjiushiweiraozhexieshujuzuoweiwomenyanjiudeyangben。
二、基於邏輯回歸的分類器
dangyangbenchubuzhenglihao,changshishiyongyibandeluojihuiguilaifenlei。yikaishiwoxiangzonghekaolvsuoyouzhizuanguwenduichuangyidefenleidekaolv,yincixiangmoxingshedingweiluojihuigui。moxingquchuleduishijianlianggangyouyilaideweidu。liru,xiaohao,yinweibutongshangjiakenenghuiyinweitiliangdedaxiaoerzaibenzhishangyouchabie;類似的維度還有展現和點擊等。本次實驗把這些維度全部去掉,保留沒有依賴時間為量綱的點擊率、點擊單價和收藏率等維度。
本次邏輯回歸的最多迭代100次,拿數據當中的85%作為訓練,15%作為驗證集來訓練模型。得到如下結果:
真正率指的是所有被顧問認定為較好創意的數據,其中被模型預測為較好創意所占的百分比;真負率指的是所有被顧問認定為較差創意的數據,其中被模型預測為較差創意所占的百分比;準(zhun)確(que)率(lv)值(zhi)得(de)是(shi)所(suo)有(you)數(shu)據(ju)當(dang)中(zhong),模(mo)型(xing)預(yu)測(ce)與(yu)源(yuan)數(shu)據(ju)相(xiang)符(fu)所(suo)占(zhan)總(zong)數(shu)的(de)百(bai)分(fen)比(bi)。可(ke)以(yi)輕(qing)易(yi)看(kan)出(chu),真(zhen)負(fu)率(lv)比(bi)較(jiao)高(gao),但(dan)真(zhen)正(zheng)率(lv)較(jiao)低(di)。所(suo)以(yi)本(ben)實(shi)驗(yan)對(dui)於(yu)那(na)些(xie)較(jiao)好(hao)創(chuang)意(yi)的(de)預(yu)測(ce)準(zhun)確(que)性(xing)不(bu)夠(gou)高(gao)。
邏輯回歸中各維度的參數如下:
參數說明:維度當中的參數的正負說明該維度對模型預測為較好創意的貢獻方向,例如:點擊單價的參數為負數,說明點擊單價越高,越不能對其預測較好創意,所以方向是負的;而點擊率參數為正數,說明點擊率越高,越能對其預測為較好創意,所以方向是正的。
從這個表中有如下結論:
1. 綜合所有數據,顧問對於一張創意是否為一張好的創意,最重要看的維度從高到底是點擊率、收藏率、加購率和回報率。這三者可以起到決定性的作用;
2. 點擊單價、收藏成本和加購成本的決定作用在第二階級,其決定性因素不如第一點提到的因素。
三、去除依賴時間的數據維度的SVM分類器
由於邏輯回歸對於真正率來說不夠高,因此想用SVM分類器(Suport Vector Mechine )。雖然其訓練效率低,當時它對於低維密實的向量有較好的敏感性,所以嚐試使用它來做為此訓練。模型訓練參數中伽馬等於2,閾值為1e-4,訓練結果如下:

與邏輯回歸相比,真正率大幅升高,而且整體的準確率也得到提高,所以該模型作為一個候選模型。
四、基於Dense網絡的分類器
當使用SVM分類器時,發現雖然整個模型的準確率很高,但是真正率、真zhen負fu率lv和he準zhun確que率lv三san者zhe還hai是shi有you一yi定ding差cha異yi,這zhe導dao致zhi整zheng個ge模mo型xing預yu測ce的de結jie果guo不bu穩wen定ding,很hen容rong易yi在zai以yi後hou的de使shi用yong當dang中zhong,因yin為wei數shu據ju結jie構gou不bu同tong而er導dao致zhi預yu測ce準zhun確que性xing受shou到dao質zhi疑yi。再zai者zheSVM的參數調整太過於麻煩,而且其預測速度太慢,因此想找更優的方法。
最後,我確定了使用Dense網(wang)絡(luo),它(ta)與(yu)一(yi)般(ban)的(de)全(quan)連(lian)接(jie)網(wang)絡(luo)區(qu)別(bie)在(zai)於(yu)它(ta)對(dui)於(yu)隔(ge)層(ceng)網(wang)絡(luo)數(shu)據(ju)是(shi)有(you)複(fu)用(yong)的(de),與(yu)傳(chuan)統(tong)全(quan)連(lian)接(jie)網(wang)絡(luo)隻(zhi)與(yu)鄰(lin)接(jie)層(ceng)有(you)關(guan)大(da)大(da)不(bu)同(tong)。這(zhe)一(yi)特(te)點(dian)使(shi)得(de)它(ta)有(you)諸(zhu)多(duo)優(you)點(dian):
(1)有效解決梯度消失問題;
(2)強化特征傳播 ;
(3)支持特征重用;
(4)大幅度減少參數數量。
因此,對於少維度的輸入,其複用特征有利於梯度的反饋。模型的當中的反饋函數使用”relu”,它比一般的“sigmod”更靈活,為了避免過擬合,每層網絡訓練完一次後都會有50%的幾率抑製神經元,訓練次數設定為100次,學習訓練優化器使用自適應動態二階學習函數: “RMSprop”.基於以上數據搭建Dense網絡,而網絡輸入的是每個創意數據,輸出是該創意是否為優質創意。
在訓練網絡的過程中,發現去除時間維度的數據有可能影響整個網絡的訓練。就是有相當一部分創意,它的收藏率、加購率和回報率等維度都為0,因yin為wei這zhe種zhong數shu據ju過guo多duo,導dao致zhi網wang絡luo對dui不bu好hao的de創chuang意yi判pan斷duan出chu現xian了le偏pian差cha,對dui非fei優you質zhi創chuang意yi的de預yu測ce能neng力li有you下xia降jiang。因yin此ci在zai樣yang本ben的de處chu理li上shang,對dui這zhe些xie數shu據ju有you了le刪shan減jian。
神經網絡與前兩種相對比,發現真正率、zhenfulvhezhunquelvsanzhefeichangjiejin,erqiedoubizhiqiandegao,bingqietongguoduocixunliandoudedaoxiangsidejieguo。shuomingduiyubencishiyanlaishuo,shiyongshenjingwangluodexiaoguowendingxingzongshiyouyuqianliangzhe,yincixuanzeqizuoweizuizhongdeyucemoxing。
五、初步實踐運用
既ji然ran已yi經jing有you了le模mo型xing,那na我wo們men以yi後hou隻zhi要yao輸shu入ru某mou張zhang創chuang意yi的de信xin息xi,模mo型xing立li刻ke就jiu可ke以yi輸shu出chu它ta是shi較jiao好hao創chuang意yi還hai是shi一yi般ban的de創chuang意yi,而er且qie該gai創chuang意yi有you多duo大da的de可ke能neng性xing是shi好hao創chuang意yi,有you多duo大da可ke能neng性xing是shi一yi般ban創chuang意yi。
例如,我們有一張創意,近30天數據如下: [2,7,1.8,0.08,0.01,0.02,86,80,0.6],這代表它是奶粉/輔食/營養品/零食類目,第七層級,點擊單價是1.8,點擊率8%,收藏率1%,加購率2%,收藏成本86元,加購成本80元,點擊回報率是0.6。
從運行結果截圖可以看出,輸出結果為零,即預測為較一般的創意;而且它被預測為一般創意的概率達到95%,被預測為較好創意的概率隻有5%,因此它隻能被當做較一般的創意。
例(li)如(ru),我(wo)們(men)有(you)一(yi)份(fen)十(shi)二(er)月(yue)的(de)創(chuang)意(yi)數(shu)據(ju),然(ran)後(hou)我(wo)們(men)逐(zhu)個(ge)輸(shu)入(ru)來(lai)預(yu)測(ce),預(yu)測(ce)出(chu)來(lai)的(de)結(jie)果(guo)我(wo)們(men)就(jiu)可(ke)以(yi)主(zhu)動(dong)告(gao)訴(su)智(zhi)鑽(zuan)操(cao)作(zuo)人(ren)員(yuan)有(you)哪(na)些(xie)創(chuang)意(yi)不(bu)太(tai)好(hao),需(xu)要(yao)更(geng)改(gai);哪些創意表現較好,繼續仿照風格文案出創意,大大降低人工篩選分析的時間,把更多的時間投入到店鋪本身的工作中。
六、總結:
當我們擁有大量數據時,我們應該做的是讓它指導我們的工作;當(dang)我(wo)們(men)懂(dong)得(de)如(ru)何(he)讓(rang)曆(li)史(shi)指(zhi)導(dao)我(wo)們(men)工(gong)作(zuo)的(de)時(shi)候(hou),就(jiu)應(ying)該(gai)讓(rang)它(ta)成(cheng)為(wei)一(yi)種(zhong)模(mo)型(xing)化(hua)的(de)標(biao)準(zhun)來(lai)自(zi)動(dong)執(zhi)行(xing)。所(suo)以(yi),通(tong)過(guo)大(da)量(liang)數(shu)據(ju)構(gou)造(zao)創(chuang)意(yi)分(fen)類(lei)器(qi)的(de)模(mo)型(xing),以(yi)後(hou)我(wo)們(men)隻(zhi)需(xu)要(yao)定(ding)期(qi)訓(xun)練(lian)模(mo)型(xing),它(ta)就(jiu)能(neng)自(zi)動(dong)地(di)按(an)照(zhao)以(yi)前(qian)智(zhi)鑽(zuan)顧(gu)問(wen)的(de)想(xiang)法(fa)分(fen)類(lei)創(chuang)意(yi)。
一來可以降低人工成本,解放更多的生產力,讓顧問有更多的時間去做店鋪的事情,而不是重複分析;二來可以讓模型成為一個統一的分析標準,避免因為人為的原因對店鋪分析有雙重標準。讓創意得到更公平更廣泛的判斷。
本次實驗也找到一些亮點,對於本次實驗的數據來說,一張好的創意其實考慮較多的是點擊率、收藏率、加購率和回報率等維度,這可以幫助我們以後的操作人員需要更加關注這些維度來分析創意。
通(tong)過(guo)本(ben)次(ci)項(xiang)目(mu),可(ke)以(yi)由(you)創(chuang)意(yi)數(shu)據(ju)作(zuo)為(wei)一(yi)個(ge)出(chu)發(fa)點(dian),讓(rang)更(geng)多(duo)的(de)電(dian)商(shang)數(shu)據(ju)訓(xun)練(lian)為(wei)模(mo)型(xing),使(shi)得(de)推(tui)廣(guang)更(geng)加(jia)智(zhi)能(neng),讓(rang)電(dian)商(shang)真(zhen)正(zheng)沐(mu)浴(yu)在(zai)人(ren)工(gong)智(zhi)能(neng)的(de)陽(yang)光(guang)下(xia)。
輸入店鋪信息,獲取專業全方麵分析
* 您的信息將被嚴格保密,請放心填寫