有需求在,但如果技術(shù)上達不到可用性要求,那也是白搭。
早期計算機計算能力有限,可獲取的用戶數(shù)據(jù)也有限,推薦算法大都是在實驗室環(huán)境下做學(xué)術(shù)研究,真正商用還有比較大的風(fēng)險。隨著互聯(lián)網(wǎng)的高速發(fā)展,特別是搜索引擎相關(guān)技術(shù)的發(fā)展,計算能力已經(jīng)不是問題,而且大規(guī)模的用戶數(shù)據(jù)收集也已經(jīng)不是難事。這樣基于大樣本數(shù)據(jù)的實時分析處理系統(tǒng)(大數(shù)據(jù))可以快速分析出群體行為的概率分布,再將這些概率分析應(yīng)用到個體用戶上,就產(chǎn)生了智能推薦的體驗。例如搜狗的云輸入法,基本原理很簡單,就是通過概率計算你要輸入的下一個字可能是什么。但這在后臺需要一個龐大而復(fù)雜的實時分析處理系統(tǒng)。
另外對人類語言及語義的計算機識別處理,有一門專門的學(xué)科叫自然語言處理,也有的叫計算語言學(xué)。之前主要研究的領(lǐng)域是自然語言的機器翻譯,它的基本邏輯就是通過機器學(xué)習(xí)和訓(xùn)練,通過統(tǒng)計分析大量人類已有的文章、句子、詞匯和詞匯之間的概率分布情況是什么,根據(jù)語義來配對。中科院、微軟、谷歌等大機構(gòu)都投入大量資源在做研究,發(fā)了大量的paper,取得了非常不錯的效果。
學(xué)術(shù)研究在前,商業(yè)應(yīng)用在后,給智能推薦的效果提供了堅實的技術(shù)基礎(chǔ)。