從好幾年前開始,Google 就已經在機器學習領域裡耕耘,也陸續將此技術導入到各項 Google 服務中,像是大家熟悉的 Google 圖片、Pixel 2 人像模式等等,事實上 Youtube 也不例外,精準推薦用戶最適合、最感興趣的影片,就是靠它來實現,而為了讓我們能更了解其運作原理,Google 今天就舉辦一場 Youtube 機器學習講座。
2011 年之前,Youtube 的推薦影片功能都是以觀看次數作為演算基礎,當時他們認為用戶對某個主題看了很多次,就代表對它有興趣,但長期下來卻發現到,這其實沒辦法直接反應是否符合用戶需求。
用戶很可能是找了 3、4 次才發現真正有興趣的影片,而過程中這些快速略過的影片就不適合拿來參考。因此 2011~2012 年,Youtube 就把演算法修改成「觀看時間」,雖然觀看次數一天下降 20%,但平均觀看時間卻從原本的 120 秒,提升到 140 秒,代表著推薦的影片變得更符合用戶興趣:
而 2014~2015 年進入行動時代後,Google 也開始導入機器學習技術,來加強推薦系統,讓推薦影片更精準。只不過這不是一個簡單任務,有很多問題需要解決,Google 就舉例三個主要挑戰:1. Youtube 上有非常龐大的資料規模,每分鐘超過 500 萬小時影片上傳;2. 每天都有新的影片上傳,加上創作者也希望第一時間就能讓用戶知道,因此必須能快速比對這些影片適合哪些用戶;3.為了推薦精準,用戶顯性與隱性的使用回饋都是要納入訓練的資料,像是喜歡、不喜歡按鈕、觀看時間等等,因此資料相當的雜:
機器學習基礎系統是使用 Google 的開源 TensorFlow,由兩個神經網路結合而成,首先數百萬部 Youtube 影片會進入第一個「候選生成模型」,利用瀏覽歷史、搜尋歷史以及年齡等資訊,先找出與用戶相關的影片,把這些資料縮小成多個數百個資料子集,然後再進到第二個「排名模型」,接著再透過各項更細節的特徵,如:語言、用戶近期觀看紀錄、受不受歡迎等等,為每部影片評分,進而變成只剩下數十個推薦影音:
隨著推薦功能導入機器學習技術後,可說是越來越符合用戶需求,目前已經有超過七成的觀看時間,都是來自觀看 Youtube 自動推薦的影片內容。同時過去三年,使用者在 Youtube 首頁點擊推薦影片的觀看時間,也成長了 20 倍。
除了推薦影片,今年六月起 Youtube 也把機器學習應用在辨識含暴力或宣揚極端主義的影音內容,根據數據顯示,現在已經有超過八成的影片,是用戶還沒提出任何檢舉前,就已經從 Youtube 上移除,成效也非常明顯: