- 簡(jiǎn)體
- 簡(jiǎn)體中文 English
如何增加廣告點(diǎn)擊率,先要了解點(diǎn)擊率模型
那么什么是點(diǎn)擊率模型呢?
計(jì)算機(jī)科學(xué)里,點(diǎn)擊模型(Click Model)是對(duì)用戶點(diǎn)擊行為的建模。根據(jù)用戶的歷史點(diǎn)擊信息,對(duì)用戶的興趣和行為進(jìn)行建模,以對(duì)用戶的未來點(diǎn)擊行為進(jìn)行預(yù)測(cè),提高相關(guān)性。
在搜索引擎中,點(diǎn)擊模型是指對(duì)用戶的歷史點(diǎn)擊文檔進(jìn)行建模,用來預(yù)測(cè)文檔相關(guān)性。
網(wǎng)頁(yè)SEO搜索排序傳統(tǒng)上基于人工設(shè)計(jì)的排序函數(shù),如BM25等。近幾年,排序?qū)W習(xí)的引入大大的降低了融合大量特征的繁瑣程度,不過由于排序?qū)W習(xí)是監(jiān)督學(xué)習(xí),因此需要大量的人工標(biāo)注人員對(duì)文檔進(jìn)行標(biāo)注,這需要大量的人工成本,而且由于營(yíng)銷型網(wǎng)站建設(shè)網(wǎng)頁(yè)的相關(guān)性會(huì)隨著網(wǎng)頁(yè)內(nèi)容的更新等發(fā)生變化,尤其是時(shí)效性類的新聞網(wǎng)頁(yè),保持所有的人工標(biāo)注是最新的是不可行的。
用戶的點(diǎn)擊日志記錄了用戶對(duì)搜索結(jié)果滿意程度的重要信息,能夠提供對(duì)相關(guān)性預(yù)測(cè)價(jià)值非常高的信息。相比較人工標(biāo)注而言,點(diǎn)擊的獲得成本更低,而且點(diǎn)擊體現(xiàn)的總是最近的相關(guān)性。
一、為什么要建立一個(gè)點(diǎn)擊率模型?
無論是人工運(yùn)營(yíng)還是機(jī)器決策,我們都希望對(duì)某條廣告或內(nèi)容可能的點(diǎn)擊率有一個(gè)預(yù)判,以便判斷哪些條目應(yīng)該被放在更重要的位置上。這件事兒看起來并不難,比如說我有十條內(nèi)容,在歷史上呈現(xiàn)出來的點(diǎn)擊率各個(gè)不同,那么只需要根據(jù)歷史點(diǎn)擊率的統(tǒng)計(jì)做決策即可,似乎并沒有什么困難。
然并卵。直接統(tǒng)計(jì)歷史點(diǎn)擊率的方法,雖然簡(jiǎn)單易操作,卻會(huì)碰到一個(gè)非常棘手的問題。首先,大家要建立一個(gè)概念:不考慮位置、時(shí)間等一系列環(huán)境因素,絕對(duì)的點(diǎn)擊率水平是沒有什么太大意義的。比方說,下面的一個(gè)廣告,分別被放在圖中的兩個(gè)位置上,統(tǒng)計(jì)得到前者的點(diǎn)擊率是2%,后者的點(diǎn)擊率是1%,究竟哪個(gè)廣告好一些呢?其實(shí)我們得不出任何結(jié)論。
于是,聰明的運(yùn)營(yíng)想到一個(gè)辦法,干脆我在不同的位置上分別統(tǒng)計(jì)點(diǎn)擊率,然后分別排序。這個(gè)思路從道理上來說無懈可擊,相當(dāng)于直接求解聯(lián)合分布;不過,其實(shí)用價(jià)值并不高:在每個(gè)位置上分別統(tǒng)計(jì),大多數(shù)廣告或內(nèi)容條目的數(shù)據(jù)都太少,比如說100次展示,產(chǎn)生了一次點(diǎn)擊,這難道能得出1%點(diǎn)擊率的結(jié)論么?
那能不能再換一個(gè)思路,找到一些影響點(diǎn)擊率的一些關(guān)健因素,對(duì)這些因素分別統(tǒng)計(jì)?這實(shí)際上已經(jīng)產(chǎn)生了“特征”這樣的建模思路了。比如說,廣告位是一個(gè)因素,廣告本身是一個(gè)因素,用戶的性別是一個(gè)因素,在每個(gè)因素上分別統(tǒng)計(jì)點(diǎn)擊率,從數(shù)據(jù)充分性上是可行的。不過這又產(chǎn)生了一個(gè)新的問題:我知道了男性用戶的平均點(diǎn)擊率、廣告位S平均點(diǎn)擊率、某廣告A的平均點(diǎn)擊率,那么如何評(píng)估某男性用戶在廣告位S上看到廣告A的點(diǎn)擊率呢?直覺的方法,是求上面三個(gè)點(diǎn)擊率的幾何平均。不過這里面有一個(gè)隱含的假設(shè):即這三個(gè)因素是相互獨(dú)立的。然而當(dāng)特征多起來以后,這樣的獨(dú)立性假設(shè)是很難保證的。
特征之間獨(dú)立性,經(jīng)常對(duì)我們的結(jié)論影響很大。比如說,中國(guó)的癌癥發(fā)病率上升,到底是“中國(guó)”這個(gè)因素的原因呢?還是“平均壽命”這個(gè)因素的原因呢?顯然這兩個(gè)因素有一些相關(guān)性,因此簡(jiǎn)單的分別統(tǒng)計(jì),往往也是行不通的。
那么怎么辦呢?這就要統(tǒng)計(jì)學(xué)家和計(jì)算機(jī)科學(xué)家出馬,建立一個(gè)綜合考慮各種特征,并根據(jù)歷史數(shù)據(jù)調(diào)整出來的點(diǎn)擊率模型,這個(gè)模型既要考慮各種特征的相關(guān)性,又要解決每個(gè)特征數(shù)據(jù)充分性的問題,并且還要能在大量的數(shù)據(jù)上自動(dòng)訓(xùn)練優(yōu)化。這就是點(diǎn)擊率模型的意義,這是一項(xiàng)偉大的、光榮的、正確的、有著極大實(shí)用價(jià)值和戰(zhàn)略意義的互聯(lián)網(wǎng)+和大數(shù)據(jù)時(shí)代的重要工作。那位說了,有必要抬得這么高么?當(dāng)然有必要!因?yàn)檫@門手藝我也粗通一點(diǎn)兒,不吹哪行。
二、怎樣建立一個(gè)點(diǎn)擊率模型?
這個(gè)問題比較簡(jiǎn)單,我們就不多談了。(想罵街的讀者,請(qǐng)稍安勿躁,繼續(xù)往下看。)
三、如何評(píng)估一個(gè)點(diǎn)擊率模型?
評(píng)估點(diǎn)擊率模型的好壞,有各種定性的或定量的、線上的或線下的方法。但是不論什么樣的評(píng)測(cè)方法,其本質(zhì)都是一樣,就是要看這個(gè)模型區(qū)別被點(diǎn)擊的展示與沒被點(diǎn)擊的展示之間的區(qū)別。當(dāng)然,如果能找到一個(gè)離線可以計(jì)算的量化指標(biāo),是再好不過了。
這樣的指標(biāo)是有一個(gè),就是如下圖所示的ROC曲線下的面積,術(shù)語(yǔ)上稱為AUC。(關(guān)于ROC和AUC的詳細(xì)介紹,請(qǐng)大家參考《計(jì)算廣告》第*章。)AUC這個(gè)數(shù)值越大,對(duì)應(yīng)的模型區(qū)別能力就越強(qiáng)。
好了,為了讓大家深入理解點(diǎn)擊率模型評(píng)測(cè)的關(guān)鍵,我們要談到一個(gè)常見的口水仗:有一天,有兩位工程師在閑談,一位叫小優(yōu),一位叫小度。他們分別負(fù)責(zé)某視頻網(wǎng)站和某網(wǎng)盟廣告的點(diǎn)擊率建模。小優(yōu)說:最近可把我忙壞了,上線了個(gè)全新的點(diǎn)擊率模型,把AUC從0.62提高到0.67,效果真不錯(cuò)!哪知道小度聽了哈哈大笑:這數(shù)據(jù)你也好意思拿出來說,我們的AUC早就到0.9以上了!
那么,是不是小度的模型比小優(yōu)真的好那么多呢?當(dāng)然不是,我們看看該視頻網(wǎng)站和網(wǎng)盟的廣告位分布,就一目了然了。
什么?你還沒有明白,那么我建議你自己好好把這個(gè)問題想清楚。不論你是運(yùn)營(yíng)還是產(chǎn)品,經(jīng)過了這樣的思考,你的數(shù)據(jù)解讀能力會(huì)上一個(gè)臺(tái)階。
好了,三個(gè)關(guān)鍵點(diǎn)說完了,我知道有的讀者還會(huì)對(duì)第二點(diǎn)表示沒看懂,那干脆我們就再多說一點(diǎn)兒,將2015年11月15日王超在計(jì)算廣告讀者微信群里所做的題為“點(diǎn)擊率預(yù)估趨勢(shì)淺析”的分享內(nèi)容整理發(fā)布在下面。沒有堅(jiān)持到這里就把文章關(guān)掉的碼農(nóng)們,讓他們后悔一輩子去吧!
今天分享一下點(diǎn)擊率預(yù)估近年來的一些趨勢(shì)。主要結(jié)合劉鵬老師的一些指導(dǎo),以及自身工作的一些經(jīng)驗(yàn),有偏頗的地方請(qǐng)大家多多指正。
在計(jì)算廣告第一版的書里,主要講到了經(jīng)典的點(diǎn)擊率預(yù)估模型邏輯回歸,特征工程,模型的評(píng)估等,相信對(duì)大多數(shù)場(chǎng)景來說這一步是必做的基線版本。后續(xù)可以在此基礎(chǔ)上做一些更細(xì)致的特征工程和模型工作??紤]到群里的朋友都已經(jīng)拿到了這本書,今天先跳過書里覆蓋的內(nèi)容,講一些目前書里沒有提及的部分。如果對(duì)書里內(nèi)容還不夠了解的朋友,建議第一步還是把書中基礎(chǔ)性的內(nèi)容仔細(xì)掌握。
建站流程
-
網(wǎng)站需求
-
網(wǎng)站策劃方案
-
頁(yè)面設(shè)計(jì)風(fēng)格
-
確認(rèn)交付使用
-
資料錄入優(yōu)化
-
程序設(shè)計(jì)開發(fā)
-
后續(xù)跟蹤服務(wù)
-
聯(lián)系電話
010-60259772
熱門標(biāo)簽
- 網(wǎng)站建設(shè)
- 食品網(wǎng)站建設(shè)
- 微信小程序開發(fā)
- 小程序開發(fā)
- 無錫網(wǎng)站建設(shè)
- 研究所網(wǎng)站建設(shè)
- 沈陽(yáng)網(wǎng)站建設(shè)
- 廊坊網(wǎng)站建設(shè)
- 鄭州網(wǎng)站建設(shè)
- 婚紗攝影網(wǎng)站建設(shè)
- 手機(jī)端網(wǎng)站建設(shè)
- 高校網(wǎng)站制作
- 天津網(wǎng)站建設(shè)
- 教育網(wǎng)站建設(shè)
- 品牌網(wǎng)站建設(shè)
- 政府網(wǎng)站建設(shè)
- 北京網(wǎng)站建設(shè)
- 網(wǎng)站設(shè)計(jì)
- 網(wǎng)站制作
最新文章
推薦新聞
更多行業(yè)-
一個(gè)好的網(wǎng)站建設(shè)應(yīng)該具備哪些條件
首先,企業(yè)網(wǎng)站建設(shè)也好個(gè)人網(wǎng)站建設(shè)也罷,時(shí)間的投入是最大的成本,工作效...
2018-08-30 -
網(wǎng)站制作前還需要慎重的考慮
還需要慎重的考慮,因?yàn)檫@決定著計(jì)算機(jī)的總線帶寬,有的大廠商由于庫(kù)存等各...
2012-10-15 -
微信小程序開發(fā)建議選擇什么公司?
微信的使用人數(shù)已經(jīng)越來越多了,在微信上面進(jìn)行宣傳也是能夠達(dá)到比較良好的...
2023-04-11 -
分享讓新站被百度快速收錄的技巧與心得
經(jīng)常在A5論壇的問答區(qū)看見一些“站友”提問...
2012-02-05 -
企業(yè)簡(jiǎn)約風(fēng)網(wǎng)站設(shè)計(jì)怎么樣?
隨著時(shí)代的變化,越來越多的用戶喜歡簡(jiǎn)單的網(wǎng)站,簡(jiǎn)單大氣的網(wǎng)站風(fēng)格逐漸成...
2020-10-20 -
北京企業(yè)網(wǎng)站建設(shè)中的4大重點(diǎn)
網(wǎng)站建設(shè)步驟是網(wǎng)站建設(shè)中的一個(gè)重要環(huán)節(jié),一個(gè)網(wǎng)站要看它好不好,重要的一...
2020-06-19
預(yù)約專業(yè)咨詢顧問溝通!
免責(zé)聲明
非常感謝您訪問我們的網(wǎng)站。在您使用本網(wǎng)站之前,請(qǐng)您仔細(xì)閱讀本聲明的所有條款。
1、本站部分內(nèi)容來源自網(wǎng)絡(luò),涉及到的部分文章和圖片版權(quán)屬于原作者,本站轉(zhuǎn)載僅供大家學(xué)習(xí)和交流,切勿用于任何商業(yè)活動(dòng)。
2、本站不承擔(dān)用戶因使用這些資源對(duì)自己和他人造成任何形式的損失或傷害。
3、本聲明未涉及的問題參見國(guó)家有關(guān)法律法規(guī),當(dāng)本聲明與國(guó)家法律法規(guī)沖突時(shí),以國(guó)家法律法規(guī)為準(zhǔn)。
4、如果侵害了您的合法權(quán)益,請(qǐng)您及時(shí)與我們,我們會(huì)在第一時(shí)間刪除相關(guān)內(nèi)容!
聯(lián)系方式:010-60259772
電子郵件:394588593@qq.com