YouTube 導入機器學習成果更精準推薦用戶喜愛的影片

從好幾年前開始，Google 就已經在機器學習領域裡耕耘，也陸續將此技術導入到各項 Google 服務中，像是大家熟悉的 Google 圖片、Pixel 2 人像模式等等，事實上 Youtube 也不例外，精準推薦用戶最適合、最感興趣的影片，就是靠它來實現，而為了讓我們能更了解其運作原理，Google 今天就舉辦一場 Youtube 機器學習講座。

2011 年之前，Youtube 的推薦影片功能都是以觀看次數作為演算基礎，當時他們認為用戶對某個主題看了很多次，就代表對它有興趣，但長期下來卻發現到，這其實沒辦法直接反應是否符合用戶需求。

用戶很可能是找了 3、4 次才發現真正有興趣的影片，而過程中這些快速略過的影片就不適合拿來參考。因此 2011~2012 年，Youtube 就把演算法修改成「觀看時間」，雖然觀看次數一天下降 20%，但平均觀看時間卻從原本的 120 秒，提升到 140 秒，代表著推薦的影片變得更符合用戶興趣：

而 2014~2015 年進入行動時代後，Google 也開始導入機器學習技術，來加強推薦系統，讓推薦影片更精準。只不過這不是一個簡單任務，有很多問題需要解決，Google 就舉例三個主要挑戰：1. Youtube 上有非常龐大的資料規模，每分鐘超過 500 萬小時影片上傳；2. 每天都有新的影片上傳，加上創作者也希望第一時間就能讓用戶知道，因此必須能快速比對這些影片適合哪些用戶；3.為了推薦精準，用戶顯性與隱性的使用回饋都是要納入訓練的資料，像是喜歡、不喜歡按鈕、觀看時間等等，因此資料相當的雜：

機器學習基礎系統是使用 Google 的開源 TensorFlow，由兩個神經網路結合而成，首先數百萬部 Youtube 影片會進入第一個「候選生成模型」，利用瀏覽歷史、搜尋歷史以及年齡等資訊，先找出與用戶相關的影片，把這些資料縮小成多個數百個資料子集，然後再進到第二個「排名模型」，接著再透過各項更細節的特徵，如：語言、用戶近期觀看紀錄、受不受歡迎等等，為每部影片評分，進而變成只剩下數十個推薦影音：