周杰倫演唱會人山人海,五月天演唱會門票秒空,但要問近期最火的歌手是誰,那還得是孫燕姿。在B站,用近似孫燕姿音色的AI語音生成歌曲片段的視頻多達上千條。如果你刷得足夠多,甚至會刷到一條這樣的視頻(下圖),該視頻目前已被發布者刪除。

AI語音除了用來整活,還有沒有更廣闊的應用場景?答案顯然是肯定的,就在今年4月結束的高爾夫美國大師賽上,AI語音被用來自動生成比賽片段的語音解說。
根據CNN報道,從2019年開始,高爾夫美國大師賽就承諾在賽事App和網站為觀眾提供“每一桿、每一洞”的比賽畫面。這意味著每年都會有數量巨大的比賽視頻被呈現給球迷,比如今年的比賽片段,就超過20000條。這些視頻片段不可能全部都配上人工解說,因此就有了AI解說的用武之地。
本次賽事的AI解說功能,是由美國大師賽的數字團隊和IBM公司的技術團隊合作完成的。IBM官網文章介紹,這個叫“Henry”的AI解說,實際是生成式AI,由一個大型語言模型構建而成,進行了大量高爾夫運動的用語習慣和風格訓練。該模型的具體運作方式是:
利用大師賽官方數據服務商提供的擊球、記分、統計數據以及視頻資料等信息,由AI將每個擊球的元數據轉化為描述性的文本元素→文本經過兩種神經網絡處理,進行數億次計算,生成數千個可能的句子→再由模型選擇最佳的句子,將該句子傳遞給Watson Text-to-Speech服務,轉化為聲音→然后系統會自動將音頻與視頻中的動作對齊,把語音評論添加到相應比賽片段當中。
當然,球迷并不需要了解這個過程,他們只需要訪問大師賽官方App上的“my group”功能,就能看到自己想看且配有AI解說的比賽畫面。

▲老虎·伍茲因傷中途退出了今年的美國大師賽。
北美職業賽事的解說工作,有解說員(play-by-play announcer)和評論員(color commentator)之分,解說員主要負責比賽場面的描述,評論員則側重比賽分析和延展分析。玩過FIFA、實況或者NBA 2K游戲的球迷,也許對智能語音解說并不陌生,這些游戲會邀請一些知名解說員預錄制解說旁白,使游戲更逼近真實比賽,提升玩家的沉浸體驗。游戲里簡單描述場面、重復使用措辭的旁白,接近于傳統的實況解說。而IBM和高爾夫美國大師賽推出的AI解說更加智能,經過大量訓練的AI模型,可以自行生成多樣化的句式和表達,以避免重復。
實際上早在2019年,IBM就已經開始了他們在AI解說上的嘗試,開發團隊創建了一個人工智能系統,并且在當年12月8日加拿大溫哥華舉行的神經信息處理系統(NeurIPS)AI會議上首次公開展示了該系統。這個系統會實時跟蹤球員,識別傳球、傳中和射門,然后進行實況解說。它還可以在比賽的重點時刻,結合數據庫中提取的信息進行更復雜的評論分析。也就是說,它不僅是AI解說員,還是AI評論員。不過在當時,這些重點時刻需要人工預先選擇。根據財經雜志Fortune的報道,該系統能自動創建的比賽高光視頻,高爾夫正是其中一個被用來測試合作的項目。
到今年大師賽期間,IBM對AI的開發又有了較大進展。利用AI模型分析比賽視頻,并在賽后為每個球員自動制作比賽片段的功能,已經得到正式應用。除此之外,IBM還推出了“逐洞預測”功能,可以根據往年比賽數據和實時比賽進程,預測每次揮桿的得分可能。而AI解說,則被IBM體育和娛樂團隊副總裁Noah Syken發表在IBM官網的文章中,稱為與大師賽25年合作歷史上“最重要的工作”。

從體育賽事轉播的角度來看,AI解說的推出,本質是為了給球迷提供更好的觀賽服務。Vizrt Group營銷戰略副總裁 Andre Torsvik在一篇分析人工智能促進體育轉播發展的文章中提到,轉播時提供給粉絲的額外信息越有針對性、越有信息量,就越能吸引觀眾。而AI是最能勝任這一角色的工具。
AI可以提供更快、更相關和更有洞察力的數據,比如足球比賽中的跑動距離和沖刺數據;可以與高端分析軟件結合,以提供對比賽的自動化分析,比如籃球轉播時的投籃熱區;現在又有了語音解說的能力。如果將這些分析和解說呈現在轉播視頻上,可以大大豐富觀眾第一屏、乃至第二屏的觀看體驗。
另一方面,IBM AI Research的AI技術主管John R. Smith曾對Fortune提到,AI解說的實現,可以為很多缺乏轉播機會的半職業及業余球隊提供實況解說。這也是AI解說在當下最實際的應用場景,畢竟真正重量級的比賽并不會缺少優秀的人類解說,至少目前而言,AI還無法取代他們。
從生成式AI開發的角度來看,AI解說的出現也有著一定價值。Noah Syken認為,AI解說的影響不僅局限在體育賽事解說上,它是一項將大型語言模式和生成式AI應用到企業場景的優秀案例。IBM推出的AI解說功能,至少在兩個層面為行業提供了參考,一是大型語言模型是基于大量無標簽數據進行訓練的,但IBM在此基礎上增加了“專業領域知識”的練習,使得AI解說可以適應獨特的賽事場景;二是想讓人工智能實際適用于企業環境,需要充分利用企業全面、準確和有關聯度的源數據。
屆時,AI開發人員只需添加其行業、公司或部門的專業信息,就可以快速構建專屬AI模型。Noah Syken指出,盡管AI取代人類工作的可能性已經被廣為討論,但只有看到AI解決了具體問題,人們才會真正理解它對業務的影響。

但在展開偉大設想之前,AI解說還是得先面對一些現實問題,比如它始終缺乏情感,而體育賽事解說員適時流露的情緒,往往是球迷最為津津樂道的部分。在雅虎財經的報道中,Syken回應了這個問題,他表示:“隨著我們的進展,我想你會看到我們給聲音的質感帶來一些變化。”
這至少說明,開發團隊也意識到這個叫“Henry”的AI解說目前是缺乏質感的。畢竟推特上,有球迷看到AI解說的視頻后如此評價:
這個功能真的很震撼;
我會關靜音。
聲明:本文由懶熊體育原創,轉載請注明www.atttc.com。










