無意瀏覽時(shí),以為這只是總結(jié),冠冕堂皇。今天切身感受,感慨持續(xù)深入推進(jìn)全面反詐專項(xiàng)行動(dòng)不是徒有虛名。
今天下午?13:47分,一個(gè)“0086”開頭的顯示為“四川德陽”的陌生電話打進(jìn)來,并有一排提示謹(jǐn)訪詐騙的字,我本想掛了,但一想德陽有幾個(gè)同學(xué),說不定……,我便按下了接聽鍵,對方說是圓通快遞的,問我收到快遞沒?我警覺反問:快遞不是發(fā)取件碼嘛,怎么改打電話了?“因?yàn)槟阕蛱齑吡丝爝f,所以圓通總部追蹤反饋”。我想起昨天確實(shí)在淘寶聯(lián)系賣家催了貨。
“圓通總部在北京,怎么電話顯示四川德陽?”“電話是屏蔽隨意顯示的,你現(xiàn)在看看有沒有收到取件碼,沒有的話,我們重發(fā),但你要把地址單號給我”,“你們不是有嗎,不然怎么聯(lián)系的我?”我一邊說一邊還是打開了淘寶查詢,看到了取件碼?!坝腥〖a了,不用麻煩了!”“好的!”
剛放下手機(jī),?13:56分,(023)96110來電:“你是ⅩⅩX嗎?”“是呀!”“你剛才接聽的電話,疑似詐騙,有轉(zhuǎn)款嗎?”“沒有,是圓通快遞總部的?!薄艾F(xiàn)詐騙手段花樣百出,什么快遞呀、刷單呀等都不要相信哈,千萬不要轉(zhuǎn)款哈,涉及錢都不要相信哈!”“好的,謝謝!”
14:?02分,(023)63610120——渝中區(qū)反詐中心來電:“你是住渝中區(qū)的XX女士嗎?”“是的?!薄澳愕碾娫捒赡鼙辉p騙分子盯上了,不要點(diǎn)陌生鏈接,不要點(diǎn)陌生二維碼哈,千萬不要轉(zhuǎn)款、告訴銀行卡號的,”“好的?!薄澳闶亲∮逯袇^(qū)ⅩX街道XX小區(qū)XX棟XX號嗎?需要我們派人上門宣傳反詐常識嗎?”“不需要,謝謝!”“好的,麻煩你向你身邊的親朋好友宣傳宣傳吧!”“好的,謝謝!”
媽呀,連我住哪里都一清二楚,這大數(shù)據(jù)真讓我頂禮膜拜!反詐騙中心工作人員的敬業(yè)精神更讓我佩服不已!再看短信:重慶市反詐騙中心發(fā)來4條,渝中區(qū)反詐騙中心發(fā)來4條。
有一種安全感,叫“我在中國”?,我今天真切體驗(yàn)到了!
隱私號碼保護(hù)了客戶的電話號碼信息,但是真的方便了大家了嗎。
快遞代收點(diǎn)
本人作為一個(gè)資深一線快遞從業(yè)者在我的角度來看,并沒有方便大家反而給大家?guī)砹吮姸嗖槐恪,F(xiàn)在好多社區(qū)和校園的快遞還是大部分是寄存在代收點(diǎn)的,代收點(diǎn)通知客戶取件的方式一定是發(fā)短信的,一般都會選用驛站系統(tǒng)(比如菜鳥驛站和新貴多多驛站)。之前面單信息清楚明了驛站工作人員用把槍(驛站入庫專用工具)入庫,收件人收到短信,過來按照收到的取件碼取快遞。一套操作行云流水,你儂我儂,大家都喜滋滋。改革以后都是隱私號碼,老客戶系統(tǒng)會根據(jù)收件人名字電話后四位自動(dòng)匹配識別出來收件人信息(也有姓氏和電話后四位一樣的識別錯(cuò)誤發(fā)錯(cuò)客戶的)通知客戶取件,收件人可以收到短信通知。如果是新客戶系統(tǒng)無法識別出客戶信息工作人員無法第一時(shí)間通知收件人 取件,會影響快件派送的時(shí)效。
電商平臺轉(zhuǎn)接號碼隱私號面單
大家取快遞時(shí)經(jīng)常會碰到這種交易平臺顯示快遞已到達(dá)自己最近的快遞代收點(diǎn)遲遲沒有收到取件碼,無法取件。去了驛站需要提供電話號碼或者快遞物流單號查詢才能查詢到取件碼才能取快遞。這就是現(xiàn)在快遞推行的收件人信息隱私保護(hù),初衷是好的但是還是有眾多弊端的。
散單隱私號碼面單
要想解決這個(gè)問題也是任重而道遠(yuǎn)的,個(gè)人建議有幾個(gè)方面可以盡量減少這類情況的發(fā)生:
1.加強(qiáng)快遞與驛站之間的信息的互通。主流三通一達(dá)一兔與驛站之間快遞是客戶信息的提供方,面單信息可以隱藏后臺加強(qiáng)合作爭取做到見單號自動(dòng)彈出客戶電話(菜鳥驛站與淘寶件就自動(dòng)識別)。
2.購物平臺與驛站之間的信息的互通?,F(xiàn)在大的幾個(gè)購物平臺淘B、拼DD、京D、抖Y、快S之間是存在競爭關(guān)系的,淘寶系的C鳥驛站,拼DD系的DD驛站與其他購物平臺的信息交互不通會給客戶帶來很多的不便。
以上倆點(diǎn)是本人的個(gè)人建議,僅代表個(gè)人意見。大家有更好的寶貴意見提出來大家一塊交流,本人是一名多年一線工作的快遞從業(yè)者希望有可以幫到您的地方。喜歡我的文章可以點(diǎn)點(diǎn)關(guān)注,謝謝大家。
]]>對抗是反作弊永恒的主旋律,面對對抗我們需要做到快速響應(yīng)、見招拆招、在變化中發(fā)現(xiàn)不變的本質(zhì)。
在反作弊場景中,黑產(chǎn)必須通過文本進(jìn)行信息傳遞或觸達(dá)受害者,而文本由于其生產(chǎn)成本低廉、傳遞信息能力強(qiáng)的特點(diǎn)成為了黑產(chǎn)與我們進(jìn)行對抗的主要戰(zhàn)場。文本理解算法為應(yīng)對各類強(qiáng)對抗提供了文本檢索、文本風(fēng)險(xiǎn)標(biāo)簽、風(fēng)險(xiǎn)信息提取的能力,以及一個(gè)文本模型訓(xùn)練平臺。這些能力的組合使用可有效打擊文本內(nèi)容維度的作弊行為,現(xiàn)已在反作弊的各業(yè)務(wù)場景中得到應(yīng)用。
如上所述反作弊風(fēng)控就是一個(gè)和黑產(chǎn)持續(xù)強(qiáng)對抗的過程,而強(qiáng)對抗的一個(gè)顯著特點(diǎn)就是快速的變化,所以常規(guī)的先收集標(biāo)注數(shù)據(jù)再訓(xùn)練模型的方式很難跟得上黑產(chǎn)變化的腳步。此外,黑產(chǎn)為了更多的獲利,通常會采用廣撒網(wǎng)的策略大批量將相似文本內(nèi)容投放到平臺。因此,由文本黑庫和回掃構(gòu)成的、只需單條標(biāo)注數(shù)據(jù)的相似文本檢索能力便成了我們應(yīng)對這種快速變化的有力武器,可有效識別存量和增量的問題文本,進(jìn)行合理的處置。
一般來講文本的相似大體可以分為字面相似和語義相似兩種:
想要看片加我微
想要看片加我微信
勿信海外高薪,避免上當(dāng)受騙,天上不會掉餡餅。
不要被高薪所誘惑,天上不會掉餡餅,請朋友們遠(yuǎn)離詐騙
字面相似較語義相似條件更為嚴(yán)格,因此更加準(zhǔn)確更適用于黑庫,而語義相似則有更強(qiáng)的召回能力,更適用于回掃。
檢索目標(biāo)索引特點(diǎn)適用場景回掃大盤全量數(shù)據(jù)1. 大而全;
2. 與數(shù)據(jù)源綁定,不能隨意定制索引內(nèi)容;
3. 不支持樣本隨機(jī)增刪離線;主要用于作弊內(nèi)容歷史存量治理黑庫有限樣本,一般為黑灰產(chǎn)作弊內(nèi)容。(也可以把黑庫當(dāng)白庫用,存儲白樣本)1. 小而精;
2. 用戶可自定義創(chuàng)建自己的內(nèi)容索引庫;
3. 支持樣本隨機(jī)增刪在線;主要用于新增作弊內(nèi)容管控
為了對黑產(chǎn)的變化進(jìn)行更快速的響應(yīng)及更有效地利用人工審核數(shù)據(jù),搭建了一套結(jié)合黑庫和回掃的自動(dòng)任務(wù)流,該流程讓審出數(shù)據(jù)在短時(shí)間內(nèi)便可起到上線攔截和存量處罰的作用
雖然黑產(chǎn)使用的文本在快速的變化,但只要黑產(chǎn)的目標(biāo)是明確的,那么其使用的文本在類別語義層面便具有不變性。RiskText 風(fēng)控文本標(biāo)簽體系便是針對抖音風(fēng)控場景中一些主要語義類別設(shè)計(jì)的一套文本標(biāo)簽集
如果我們每次都是針對某個(gè)非常具體的業(yè)務(wù)場景使用少量特定場景數(shù)據(jù)訓(xùn)練模型,例如評論色導(dǎo)、評論賭博導(dǎo)流等模型,那么會有以下問題:
因此一套既具備可維護(hù)、可復(fù)用、魯棒性強(qiáng)等特點(diǎn),又能很好解決業(yè)務(wù)風(fēng)控問題的文本分類標(biāo)簽體系就是我們需要的。
模型架構(gòu):多 channel 輸入對同音、形近變體更加魯棒
訓(xùn)練方法:樣本增廣 + 一致性訓(xùn)練
樣本降噪:解決數(shù)據(jù)中的錯(cuò)誤標(biāo)簽
自動(dòng)迭代
黑產(chǎn)作弊文本經(jīng)常會包含一些關(guān)鍵信息,作弊手法會變但關(guān)鍵信息不易變(或者變化成本較高),如果能夠正確識別出文本中的關(guān)鍵信息,就能有效提升防御體系魯棒性。目前已有建設(shè) 3 種風(fēng)險(xiǎn)信息提取能力:風(fēng)險(xiǎn)聯(lián)系方式、風(fēng)險(xiǎn)變體、風(fēng)險(xiǎn)文本片段。其他場景下,比如電商業(yè)務(wù)中風(fēng)險(xiǎn)地址提取,也能夠參考構(gòu)建類似能力。
抖音是流量聚集地,黑產(chǎn)為了謀利往往會將流量引到端外,進(jìn)而實(shí)施違法行為,因此識別黑產(chǎn)留下的聯(lián)系方式是一項(xiàng)重要能力。
從使用階段劃分,包含 判別->提取->風(fēng)險(xiǎn)分->風(fēng)險(xiǎn)標(biāo)簽。
黑產(chǎn)為了對抗文本識別能力,會對文本關(guān)鍵部分變體。由于大部分文本模型不會經(jīng)常更新,導(dǎo)致模型效果會隨著時(shí)間逐漸衰減。為了解決這個(gè)問題,將文本變體能力與下游文本能力解耦開,當(dāng)變體識別能力提升時(shí),所有下游任務(wù)均可受益。
PS:如果黑產(chǎn)文本變體太快,會不會跟不上,這樣能力建設(shè)有啥意義?
前期的簡單變體,我們的能力都會覆蓋,越到后期,黑產(chǎn)創(chuàng)造新變體的成本會越高,更考驗(yàn)的是能力是否在不斷迭代更新。
變體挖掘->變體判別->變體映射表流程可自動(dòng)化運(yùn)行,不斷挖掘得到新變體。
黑產(chǎn)除了對關(guān)鍵信息變體,還會對非關(guān)鍵文本做話術(shù)變換。黑產(chǎn)為了表達(dá)意圖,關(guān)鍵信息不會很發(fā)散,來來回回可能就那幾個(gè)關(guān)鍵詞,但是會變換話術(shù)以此對抗識別模型,我們只需要從黑產(chǎn)發(fā)的大量文本中,找出表達(dá)意圖的關(guān)鍵信息,即可提升系統(tǒng)對話術(shù)變換的魯棒性。
整體技術(shù)方案總結(jié)來說就兩步: