本次【產品經理菁英會社團暨PM Tone產品通】的分享主題將聚焦於【AI與物聯網結合的策略與技術】,主講者是之前任職於KKBOX IoT商務發展副理,目前在出門問問(中國10大AI獨角獸)擔任AI商業化 商務發展經理的沈品勳(Seff Shen)。首先,Seff將從全球智能語音的發展趨勢切入,和大家分享「AI」與「物聯網」如何充分結合的具體做法及如何將產品商業化的過程;其次,Seff將分享傳統的產品經理面臨AI時代的來臨,PM該如何重新定位以及該具備那些技能?才不會被時代演化所吞沒! 滿滿的case study及solution,非常充實的知識饗宴~
讓我們一起來回顧一下本場次精彩的分享吧!
以下的筆記內容由團友 Jia-Ying Liu 提供,非常感謝! ! !
AI Voice Revolution 下一代人機互動智能語音「喚」醒全球商機
【Part One】語音「喚」醒全球商機 全球智能語音大趨勢 AI 與物聯網繃出的新火花 企業也需要語音?機器人的崛起
沈品勳 Seff 從政大資管所畢業後,在 KKBOX 擔任商務發展副理的期間,點燃了對 AI 的熱情,進一步到台灣人工智慧學校進修,獲得經理人班認證,修業完成後也獲得機會加入中國 10 大 AI 獨角獸的【出門問問 mobvoi】,繼續擔任 AI 商業化商務發展經理的職務。
【出門問問】的背後投資戰略夥伴是眾所皆知的 Google,以及車界大廠 Volkswagen,同時投入在智能語音互動的研發,以及智慧車機的研發。
什麼是智能語音?
智能語音的實踐涵蓋到五種核心技術,包含:聲音信號處理、熱詞喚醒、語音辨識 ASR、語意處理 NLP,以及語音合成 TTS。
語言理解是人工智能皇冠上的明珠 – Bill Gates
而對語言理解的應用,可以廣泛應用在各種研發領域:
- 人機互動
- 神經機器翻譯 – 透過類神經網路進行自然語言翻譯
- 語言閱讀與理解 – 透過讓機器不斷的考試與學習,擴增機器的問答能力
- 機器創作 – 機器可以學習文本的一些核心特色,例如詩詞的韻律,進而運用語言元素創作
IoT 物聯網,主要有三大領域:消費物聯網、工業物聯網、智慧城市 。
而「消費物聯網」則是「智慧語音」應用的最大領域,又細分為三個主題:
- Smart Home
- Wearable Tech
- Automobile
Smart Home
出門問問投入在「智慧音箱」的研發上,認為智慧音箱是以語音連動消費物聯網的關鍵,透過智慧家居,成為打開物聯網的鑰匙。日本的 NAVER 即有開發自己的音箱,台灣遠傳也與出門問問合作出了「問問音箱」,而 Google 也加入了這個高速發展的一級戰區。
在中國,出門問問發展出「帶屏音箱」,將視覺與智能語音的結合,應用在熟齡長照的領域,協助長者紀錄日常生理數據以及常民生活的語音互動。
收斂到家庭,美國甚至發展出「語音芭比娃娃屋」,可以透過聲控進行娃娃屋的操作改造;而 Adobe 的統計數據,「語音」已經成為美國家庭選購電視、車子的重要考慮因素之一。
Wearable Tech
語音智慧穿戴的發展近幾年從未停下,出門問問也透過 Tic Watch 加入這個戰場。例如「速食店店長專用智慧錶」,因應特殊場景,嘗試透過智慧語音解決人工認知超載的問題。
Automobile
出門問問與 Volkswagen 合作了「大眾問問」,也加入了車載語音的進化浪潮。
而智慧語音帶來了哪些商機呢?SEO、Ad.、Shopping,當人們開始習慣跟智慧音箱互動時,智慧音箱提供的 content 便開始加劇對消費者的影響力,優先被播放的內容,將成為最有力的廣告互動;延伸廣告的應用,語音購物也逐漸成為電商的新通路。
不僅是單方面投放 content 的消費領域,Open Banking 是一種智慧語音在服務業的應用範例。
除了消費物聯網,企業也開始將語音應用在更廣泛的商用題目上。提到企業開發的智能語音,最有名的就是 Siri,是最早面世的語音助理,但隨著 Jobs 的離世,對 Siri 的諸多理想也未能實現,反而成為業界進化最緩慢的語音助理。
對話即平台 CaaP( Conversation as a Platform) – Satya Nadella
Chatbot:服務導向的小娜 & 聊天高手第六代微軟小冰
進一步從文字的 Chatbot,企業也將此類型智慧語音應用至 Call Center,以節省人工成本。在 Inbound 的場景,可直接進行「服務查詢、業務申辦、語音答錄以及透過聲紋辨識建構的身分核查」。在 Outbound 的部分,則包含「回訪、電銷、問卷調查」,透過越來越聰明的語音互動,篩選出低中高潛力的客戶,將人力投入在中高潛力客戶的刀口上。
較知名的 Outbound 案例是 Google 曾 demo 的 Google AI Duplex;Inbound 案例則是 2019 年 LINE 發表的 LINE BRIAN 電話語音機器人。
實體智慧機器人分為四大類型:陪伴型、迎賓型(Pepper)、服務型(獵豹移動的豹小蜜),以及特種機器人(極端環境的運輸工作等)。
從 Chatbot 到 Voicebot,各大企業前仆後繼的投入了語音發展。
- 通用語音助理:Siri、Cortana、Alexa、Google Assistant
- 企業服務整合:Nuance、科大訊飛、出門問問
- Cloud Solution Provider – SaaS: Google Cloud、AWS etc.
語音甚至也應用在醫療領域,用以解讀漸凍人的語意表達。
【Part Two】AI 時代的 PM 長什麼樣 多模態 AI 的產品解構(語音 + 機器人 + 人臉辨識)AI 所孵育的跨國與新型態工作,從 BD 角度觀察 AI PM 該具備的特質
多模態 AI 的產品結構
What’s AI? 用很多的數據和過去的規則,去推估出未來的走向。
- 訓練 Training: 利用統計原理運算變數間的數學關係,進而生成演算法。
- 預測 Inference: 基於訓練後的演算法,透過已取得的變數推論未知變數。
Machine Learning 處理可量化的元素:Dimension Reduction、Clustering、Regression、Classification。
Continuous (predicting a quantity)
Discrete (predicting a category)
Deep Learning 處理難以量化的元素:NN、RNN、CNN 為深度學習的主流模型。
AI 的應用:
- Chatbot (Google – Dialogflow)
- Voicebot (語音辨識 > 語意理解 > 語音合成 – 語素轉音素、預測持續時間、基頻預測、音頻合成)
- AIoT (商湯 – AI 人臉辨識)
- 結合 AI 的 ibon 高鐵訂票場景,縮短一半的 user journey,提升操作效率,並加入精準廣告投放應用
- 人臉啟動
- 人臉辨識
- 喚醒啟動 – 聲音信號處理、熱詞喚醒
- 精準廣告推播 – 人臉分析、年齡分析、SEO 等
- Voicebot and chat
- 深度個人化情境 – 帶屏音箱家庭娛樂 Google Home Hub
- 聲紋辨識
- 用戶畫像
- 人臉比對 / 臉部辨識 – 驗證購買
- Machine learning 喜好推薦
- 結合 AI 的 ibon 高鐵訂票場景,縮短一半的 user journey,提升操作效率,並加入精準廣告投放應用
AI 所孵育的跨國與新型態工作
- 傳統資訊系統 SI、UI / UX
- AI 資訊系統 SI、UI / UX、AI
以 IoT 產品的 ASR 訓練為例:
- 去敏(保護敏感資訊)
- 標註(標註語音正確文字作為訓練資料)
- 聲學
- 語言
- 服務化(打包語言模行為服務的 API 等工具)
- 硬體
- 佈署
Google Hangout 近期發展出即時線上會議多國語音翻譯,甚至包含繁簡中文在地化用詞轉換。
UI / UX 的需求變化 – Google Conversation Design,需考慮 Language、Technology、Psychology
- 交談人性化
- 推進對話(在相同情境,進一步以關聯性材料延伸對話的長度)
- 簡單扼要
- 串通語境
- 靈活的調整語序
- 不要教用戶怎麼說話
VUI 和過去觸控 UI 的差異 – Richart 的 App 人性對話轉帳操作是近期台灣的經典範例。
系統整合的需求變化 – 跨裝置的全通路支援:Web/App、Phone、TV、Wearable device、Smart home, etc. PM 需要能注重多種通路的產品發展。
消費物聯網的 SI 變化 – KKBOX IoT,KKBOX 透過 API、APK / AIDL、KKLINX 多重的技術開發跨裝置的 AI 訂購方案推薦。
AI PM 的 7 個特質
- 軟實力
- 現學現賣 – 會遇到連總部都沒經驗的「第一次」,快速透過網路上的資源學習、需消化思考後並實踐 。
- 教育客戶 – 與其糾結於技術語言,讓客戶感受前後差異(如節省成本、執行效率、辨識率等)和買單更重要 。
- 硬實力
- 機器學習 – 模型訓練的成長、複用性、I/O Data 與不確定性(AI 的東西是概率性的東西)。
- 雲端運算 – 模型訓練和推測(使用既有模型)為獨立作業,要有 Google Docker、最佳化運算能力與 HA 的概念。
- 全通路 – AI 將不再限於網站與 App,了解各通路、IoT 的軟硬體運作方式。
- 創造力
- 具象化 – AI 非常虛無飄渺,用簡單道理來譬喻舉例,和具象化邏輯與畫面的能力。
- 想像力 – AI 就像人的器官與腦,洞見未來的能力並創意整合不同的 AI 技術並切入市場需求。
Seff 的推薦閱讀【聲控未來 Talk to Me】討論了「紀念機器人」的市場。另一本推薦閱讀是【人工智慧在台灣】。
Gary 補充推薦了另一本【亞馬遜 2022:貝佐斯征服全球的策略藍圖】,裡面提到了 Amazon 365 的概念,以及 Amazon 的 AI 布局。
Q&A – 如何定義 AI 產品的 product roadmap?
Seff 說定義 AI 的 product roadmap 不能操之過急,要先從「打到最多產業的 AI 技術切入」,才能達到最廣泛的應用,同時蒐集模型,在市場需要時才能一步到位拿出來;同時也需要透過篩選產業、篩選客戶,精準找出產品的可能買家。
Q&A – AI 語音的時代,要如何維護資訊隱私與資料安全?
目前的 AIoT 領域,資安確實未到高度安全,在中國,情侶專用的「暖心 IoT」分手後變成「家暴 IoT」;未來逐漸使用的 blockchain 技術應可以大幅提升資安程度。
再次謝謝 Seff 的分享,也謝謝大家的參與,我們下次見 !
文字來源: Ying @ Taiwan by Jia-Ying Liu
圖片來源: 產品經理菁英會
若有轉貼需求,請來信(service@pmtone.com)討論。 轉貼時禁止修改內容及標題、須保持所有連結、禁止商業使用,並且必須註明原文標題、連結、及作者訊息。
覺得這篇文章好嗎? 請分享給您的朋友吧~