賓士官方 6 月中宣佈將車載語音助理接入 ChatGPT,這是 ChatGPT 第一次應用在汽車環境中,因為 ChatGPT 的接入,智慧汽車作業系統預計將迎來重大革新,本文將分析人工智慧(AI)將會對汽車行業帶來怎樣的改變。
(前情提要:馬斯克2023七大重點!報告特斯拉股東:全自動駕駛、人形機器人Optimus、推特轉型…)
(背景補充: )
6 月 16 日,梅賽德斯 – 賓士(Mercedes-Benz)官方宣佈將車載語音助理接入 ChatGPT。即日起,超 90 萬美國客戶可通過 Mercedes me 手機應用或語音 「Hey,Mercedes」 參與 MBUX 智慧人機互動系統測試計劃。
汽車是大模型最大的互動應用場景,這是 ChatGPT 第一次應用在汽車環境中。這一測試的結果將被用於進一步完善語音助理,為更多市場的大型語言模型提供參考,因為 ChatGPT 的接入,智慧汽車作業系統也將被重塑。
除了賓士,眾多企業也在關注和探索大模型在汽車上的應用,包括特斯拉、輝達、百度、阿里等。人工智慧和汽車的結合是國內外的迫切發展方向,沒有公司會願意在人工智慧引領的又一次革新中掉隊。
而在人人都談論 AI 的今天,我們也想簡單聊聊人工智慧將會對汽車行業帶來怎樣的改變。
延伸閱讀:ChatGPT注入特斯拉血統》自動駕駛之父Andrej Karpathy宣布加入OpenAI
更懂你的智慧座艙
大模型的出現給人工智慧的發展帶來了新的機遇和挑戰,也為汽車行業提供了新的可能性,主要的應用場景包括智慧座艙和智慧駕駛。
汽車智慧座艙是指集成了多種智慧化功能和服務的汽車內部空間,它可以通過多模態的人車互動方式,為駕乘者提供安全、舒適、便捷、娛樂的出行體驗。
人工智慧大模型在汽車智慧座艙上的應用,首先體現在語音互動方面。
語音互動是智慧座艙中最重要的功能之一,它可以讓駕乘者通過自然語言與汽車進行溝通和控制,提高出行的便捷性和安全性。
根據汽車智慧化研究機構汽勢科技的資料,2023 年上海車展上,搭載語音互動功能的車型佔比達到了 95%,其中賓士的語音互動搭載率排名第一。
而賓士之所以能在語音互動方面領先,與其採用了 ChatGPT 技術有關。賓士將 ChatGPT 整合到其 MBUX 智慧人機互動系統中,為車主提供了全新的語音助理體驗。該系統將支援更動態的對話,它不僅可以準確理解車主的語音命令,還可以與車主進行互動式對話。
其次便是影象分析方面。影象大模型可以為汽車智慧座艙提供面部識別、情緒分析、AR 相機等服務,讓駕乘者可以通過影象與汽車進行互動和娛樂。例如,商湯科技釋出的圖片生成模型 「秒畫 SenseMirage」,就可以根據駕乘者的輸入或選擇,生成各種風格和主題的圖片。
除了語音互動和影象分析之外,3D 內容大模型也可以為汽車智慧座艙賦能,它可以為其提供 3D 導航等服務。
總之,人工智慧大模型在汽車智慧座艙上的應用,可以讓汽車具有更強的感知、理解、生成、互動等能力,從而為駕乘者提供更加智慧化、個性化、場景化的出行體驗。
這是一場正在發生的互動革命,而這場革命還離不開未來交通行業的另一個重要發展方向 —— 自動駕駛。
自動駕駛再提速
自動駕駛技術是未來交通行業的重要發展方向,而 AI 是實現自動駕駛技術的關鍵技術之一。自動駕駛是指通過電腦系統的感知、決策和執行,實現車輛在不同程度上替代人類駕駛者的技術。
根據國際汽車工程師協會(SAE)的標準,自動駕駛可以分為六個級別,從 L0 到 L5,分別代表不同的自動化程度和人機互動方式,L0-L2 屬於駕駛輔助,L4-L5 才算自動駕駛。
而我們目前最高到 L3 級,即藉助人工智慧,車輛可以處理所有駕駛任務,但在緊急情況或者其他類似系統故障的情況下,仍需要駕駛員在場。
自動駕駛 L0-L5
- L0 級,人工駕駛;
- L1 級,輔助駕駛,是指車輛可以提供部分輔助功能,但仍然需要駕駛員時刻監控周圍環境,並隨時準備接管車輛;
- L2 級,部分自動駕駛,是指車輛可以提供多項輔助功能,例如同時具備 AIGC 和 LKA 的高階駕駛輔助系統(ADAS);
- L3 級,有條件自動駕駛,車輛可以在特定的場景和條件下完成所有的駕駛操作和周圍環境監控,但需要在系統要求時由人類提供適當的應答;
- L4 級,高度自動駕駛,是指車輛可以在特定的場景和條件下(例如無人物流、無人微公交、自主泊車等)完成所有的駕駛操作和周圍環境監控,並且不需要人類提供任何應答。此時,車內無需配備安全駕駛員,但仍然限定道路和環境條件;
- L5 級,完全自動駕駛,此時的車內無需配備安全駕駛員,也不限定道路和環境條件。
技術原理
自動駕駛採用電腦自主學習、高精度地圖、定位、網路通訊和鐳射雷達等資訊技術,在車輛自動行駛過程中,利用環境感知、自動決策和控制等技術,對道路行駛條件、行駛過程中可能遇到的障礙及危險進行有效的控制和避免,並對各種複雜環境和突發狀況採取行之有效的措施。它的基本原理包括了感知、決策、控制三方面。
感知是自動駕駛的基礎,是實現決策和控制的前提。感知是通過毫米波雷達、鐳射雷達、攝像頭,對車輛周圍環境進行精準識別,自主避讓前方障礙物,進行自動轉向。
決策是指車輛根據感知到的資訊,通過智慧演算法和模型,進行規劃和判斷,確定合適的工作模式和控制策略,代替人類做出駕駛決策。決策主要依賴於晶片和軟體,是自動駕駛的核心,包括路徑規劃、行為規劃、軌跡規劃、互動規劃等。
控制是自動駕駛的實現,是感知和決策的結果。它是指車輛根據決策輸出的指令,通過線控系統或機械系統,對車輛進行相應的操作執行,如轉向、加速、減速、制動等。
控制主要包括兩個方面:縱向控制和橫向控制。前一個控制車輛在行進方向上的速度和加速度,主要涉及油門和制動系統;後一個控制車輛在垂直於行進方向上的位置和角度,主要涉及轉向系統。
應用層面
人工智慧的發展顯著提高了自主駕駛系統的能力。通過機器學習演算法、電腦視覺和感測器融合技術的結合,系統能夠理解周圍環境並對其做出反應,變得更加可靠、高效和安全。
想要利用人工智慧實現徹底改變駕駛方式,主要是看自動駕駛領域的應用層面,包括環境感知、決策規劃、學習適應三個重要部分。
自動駕駛車輛結合了攝像頭、鐳射雷達、雷達和其他感測器來收集周圍環境的資料。接著,人工智慧演算法將對這些資料進行處理,以建立詳細的環境地圖,並識別物體,如行人、其他車輛、紅綠燈和路標,決定車輛該如何響應。而類似 GDDR6 的高速儲存器可以支援快速儲存和訪問資料,實現密集型計算。
而自動駕駛汽車使用人工智慧根據從感測器收集的資料能做出即時決策。例如,如果自動駕駛汽車檢測到行人橫穿馬路,它將使用人工智慧來確定最佳行動方案,進行減速或停車。
同時,預測建模與監督學習演算法能實現預測其他道路使用者的行為,例如行人在特定位置橫穿馬路和其他車輛變道的可能。這有助於汽車預測潛在的交通問題,並採取適當的行動來避免。
而無監督學習演算法可用於識別自動駕駛汽車感測器收集的資料中的異常或意外事件,例如在意外位置橫穿道路的行人或突然變道的車輛。
自動駕駛系統還可以利用機器學習和深度學習技術不斷優化自身效能。通過不斷收集和分析駕駛資料,系統可以學習和適應不同的駕駛場景,改進自己的決策能力和反應速度。
此外,強化學習技術也在自動駕駛領域發揮著重要的作用。通過強化學習,車輛可以在實際駕駛環境中不斷試錯和學習,優化其駕駛策略和決策能力。
未來駛向何方?
汽車在當代社會是人類出行必不可少的交通工具與社會發展的經濟引擎。隨著人工智慧技術的不斷進步,自動駕駛技術將逐漸商業化並進一步普及。
也有一種觀點認為,汽車也有望成為智慧移動終端的一部分。人工智慧和網際網路的發展為汽車提供了與其他智慧移動終端進行互動的能力。我們的智慧生活也會因為汽車的移動私人空間屬性,而變得更具有擴充套件性與獨特性。
作為全球市值最高的車企,特斯拉大力推行自動駕駛,勢必要將 autonomy 進行到底。國內百度 CEO 李彥巨集也表示,隨時都在發生的正常車禍不是新聞,而自動駕駛的車禍就成了新聞,究其根本原因是無人駕駛還未普及。
當然,智慧駕駛產業鏈的確還需要完善政策、成本、技術、保險等各方面因素存在的問題。但自動駕駛技術的前景一片光明,我們的出行生活也期待變得更加智慧與安全。
📍相關報導📍
Meta發表語音生成AI模型 “Voicebox”:「上下文學習」完成文本轉語音、為元宇宙化身配音