凯发一触即发2023车载全息数字人:AI Agent新场景全息投影新方向(附下载)
浏览: 次 发布时间:2024-09-08 06:12:30
二维的触摸屏幕交互潜力正在被开发殆尽-●=★,产品设计者开始考虑三维层面的人车交互•▽•,这里必须提到两个重要部件▷◇▲:
随着近两年 AIGC 生成算法和自然语言模型的发展◆▷,AIGC 已被广泛应用在文字=-▪、图像☆◁◆△•▼.音频▪•-…••、游戏和代码的生成当中●▷◁▲••,输出的内容完成度较高○◆◇★=□,已经能被广泛应用于商业化中□•…▪。目前主流的 2D 仿真数字人主要通过图片或照片完成皮套后-▼△★,迭加口型和少量动作后结合情感分析和决策机制来呈现▼□,在这一过程中◇▪□,AIGC 技术对于数字人的生成有以下的帮★●-★•☆:
近年兴起的车辆功能订阅制▽-▽▲,为 AI 产品打开了全新盈利思路△▽□,例如华为 ADS 1△☆○■.0 一次性购买 32000 元◆-▽-,订阅包年 6400 元▷◁•△●,订阅包月640元●▷■☆★○: ADS 2▷◆◇▽….0 一次性购买36000元订阅包年 7200 元△▪…□,订阅包月 720 元•▪▽◇。我们认为=◁…☆□■,车载功能订阅制有望是未来智能汽车消费的重要商业模式▪◆◆▼◁,基于此种付费模式--▽◆◇,同时考虑到智能座舱的渗透率◆☆□••▷,我们可以估算出国内智能座舱数字人的市场空间●○●=☆▷。
1)抬头显示器 (HeadUpDisplay▪■◆○▲-,HUD)△▪●=。HUD 原本用在战斗机上☆••,以提升飞行员的驾驶效率◇•◆★▪,飞行员不必频繁低头看仪表就能获得飞行数据★■■▼▷●,也便于飞行员进行瞄准操作…▼,这一产品逻辑平移到汽车•◇★,便成为了替代传统仪表盘的一种新鲜工具••▽★,驾驶者不必低头从视野前方就可以查看车速及导航信息○☆▷,极大提升驾驶体验★▼◁□☆▲。
3)屏幕互联时代•▲。车机应用进一步发展★…◁==□,车联网(V2X) 概念兴起★▼☆,自动驾驶与智能座舱开始祸合-◁▲•,依靠车载芯片算力的独立车机系统出现☆□★…★;
Whisper API 是一个用于开发者的语音识别接口…☆,它可以让用户将语音转换为文本◁○◇。它使用了一个深度神经网络模型○▷★-□□,训练在大量的语音数据上▽▽-●,以达到高准确度▽▪■…▼=,Whisper API可以识别多种格式的音频文件□▼,包括 mp3▪-▲☆…,mp4▲▼△=•★,mpeg○■,mpga■=▼◆●,m4a•-☆•☆,wav或 webm●◆△○=。Whisper API 的优势是它有极高的速度□▼,方便的按需访问◇△,和合理的价格◁☆。这一举措将使得数字人的交互体验向前推进一大步■▲。
⚫ 估算逻辑三□-◁▷▽•:HUD 渗透率▪◁●=。根据 IHS Markit=□◁▷•,HUD 渗透率 2022 年仅 10%▪■□,此前被 海外供应商垄断■▽☆,今年来市场玩家涌现•▽★,迭加 CR5 下降☆-=●▼•,HUD 渗透率有望快速提 升●•◆△▼。
当下★…-▲▷,智能座舱数字人因何而被催化◁-○▼▷◆?我们认为◁○▼,生成式 AI 的爆发给予智能座舱数字人•□○☆◆“灵魂=◇”▪•△◆-•,全息 HUD 和高算力智能模组给数字人添加■▼▲“骨肉■…”凯发一触即发▪■▷▷,而座舱智能化时代△…,数字人被给予更多的施展能力的空间凯发一触即发▲▷=■□◁。
AI Agent(人工智能体)在大模型快速发展的驱动下进入加成长期★-=◆◁。诸如 GPT 等 LLM应用在更新信息□★、处理多轮对话和面对复杂任务时依然存在局限■◆■•,AIAent 通过增加规划=▪▷••■、记忆和工具使用三大能力克服了这些局限▽◆…◁◇=,极大扩展了大语言模型的应用范围■-◁,使其能够胜任更加复杂的任务…★,这为 AI Agnt 扮演人类日常生活的•●△=◇“助理△▲▷△”提供了可能▲★■。
垂直领城大模型正在向汽车渗透◁○•-•。今年 7 月 31日■◁•□,吉利汽车集团在内部经营工作大会上透露▲◇●△△▽,吉利将于下半年发布★○□▽“行业首个全栈自研的全场景 AI 大模型-△…◁”△◇■●◁,首款 AI 智能电混家轿▲…•“吉利银河 L6▲△▼☆□”也于9 月上市◁▪-△。银河 L6 所搭载的 AI车外语音交互技术●…★◁▽,可支持车外距离 1▷■.5 米内○◆=,通过语音指今控制车窗◁△◇…•■、空调△☆、后备箱的开启和关闭▽★○,以及自定义趣味语音包和词库…★◇▽,构建车内外无障碍沟通的全新社交场景◆★■☆…。新车还将首发吉利地图导航▼☆,支持红绿灯倒计时读秒◇●●△…=,甚至车内的香氛系统▪○-▽,也可以根据不同场景智能识别释放我们认为★▽▽△…●,在愈发激烈的市场竞争中•-……,AI将是车厂升级智能化△△○▽○、做出差异化的不二选择★•◇•▪■,2024年汽车垂类 AI 应用有望爆发▪□。
1)按钮时代▼△•○▼。1924年☆◇●▽▼=,雪佛兰生产出第一辆配备收音机的汽车☆=,1941 年▼▷■○,凯迪拉克推出配置电动车窗的 75系列…◆-★,1960 年代◁◇■●■,福特和摩托罗拉将磁带机△…“搬进•◆▼”汽车■-□…=;
⚫ 估算逻辑五•=▷•:智能座舱数字人渗透率▪☆▽▪★。我们可以按悲观/中性/乐观…▼,分别给予 20%/50%/80%的渗透率计算▲-…△。
蔚来 NOMI 人气相当火热=▲□,智能座舱数字人的市场前景乐观•■•◇=。而在汽车这一消费产品中▽△-▽,NOMI 选装比例达到 80%以上○★,唯有应用-算力(也就是收入-成本) 的飞轮实现旋转●-▽。
未来的人机交互不会停留于冰冷的屏幕和音响△▪◁○。传统的人车交互使用中控屏幕作为介质蔚来的 NOMI 将智能助手具象化成一个机器人像▲•◁●▪,若再进行更深的具象化展现★☆◁△--,数字人无疑是最佳路线■…▽。以校镜全息的数字人交互平台为例▪▽□,其基于云端及本地动态行为数据库☆○○▽-○,根据不同场景驱动虚拟人形象◁▼=-▼□,扩展虚拟人的使用场景及价值■□■▽。同时提供基于数字资产的海量周边素材▪-△★■□,支持数字虚拟人个性化形象选择★▲◁□•△、装扮搭配等☆=,打造用户专属的智能虚拟伴侣○▼◇▷…。
自动驾驶等级划分★◁▷■,目前被国内外广为接受的是 SAE(国际汽车工程学会) 分级★▲•■☆○,从Level-0~Level-5总计 6 个级别□▼▽★★-,Level-0 为最低级别▼□□★,Level-5 为最高级别•□▲■◆▽,如下图★•-,从无自动化◇…••,到△▼▲△•“解放双脚•○•=”●○▼,●…▷▲==“解放双手△•★=◇”▽▪▷,★◇◁●“解放双眼■▼”•▷-,◆■▽▪▲“解放大脑◁•◁”◆○☆,最终达到完全的■●•▲“无驾驶员-■▪◇•”化△◇•★□■。
汽车驾驶座舱硬件发展史○▲○=,就是消费电子产品发展的缩影▼▪▽••,从硬件驱动到应用驱动◁-■•●,从本地基础娱乐☆★、导航▼-•,到人车物的智能互联=□▷○,我们将汽车座舱分为 4 个发展阶段●■。
由于汽车本身价格相对高昂▪★▷△,持平增强现实…▪△•☆,我们一直强调…=,这类智能助手几千元的选装边际成本相对较低☆△-▼■▼,生成式 AI 才可以健康发展下去●•▪★◆,据 2022 年至简车言统计的蔚来二手车数据●▷□□☆,因此就可以吸引到更多用户选装☆•△▲▼★。智能座舱和 HUD 渗透率快速提升◁•◇★•,仅次于NIOPilot 自动驾驶功能包▽…-•。
2)边缘算力模组◆…▲。AI 飞轮发展滚滚向前■★■□●◆,从今年初 GPT-3•▼★☆.5 惊艳世界◆▲▪▷,到5月14 日OpenAI 正式开启插件功能△-,我们见证了云端大模型的快速选代与演化▼◁◆。当前时点◁-△,AI大模型已经站在了从•☆▪○“玩具▼•▷△□”向★★●“工具●○□●◆”快速演化的关键选代期▲◆■☆=▷。如何让大模型渗透进入各类垂直场景☆▼,如何更低成本的使用大模型…☆,如何让更多场景与用户接触 AI★…◆◇,成为了发展的下一个重点▽▽。在 AI向实际场景落地时△▪◇▽▼,边缘算力的重要性加速凸显▪★…◆=●,边缘算力在成本…■、时延●□•、隐私上具有天然优势☆•▲,也可以作为桥梁△◇,预处理海量复杂需求▲-▽■◇△,并将其导向大模型◆▲▲○。边缘算力作为 AI 触及万千场景的血管地位加速明晰▽★□。之前■◆▽◆☆▼,边缘侧设备以部署通信能力为主○-,当下▲▲••,在以高通为代表的边缘巨头推动下□△,算力●■•■▲、AI 能力等边缘基建正在加速推动▽-,同时三大运营商的算力网络与边缘资源池体系●○○△▷,也为我国算力梯度分布莫定了雏形▼◁…★▽▪。展望未来…△•■▽,边缘算力将始于 AI 带来的需求提升…○▪●◆,同时也将赋能应用□☆,连接更多用户●△▷◁…,加速 AI发展与迭代▪◁●▷▼★。
目前▼★,数字人的各种人设和行为皆是团队编辑好的剧本■▲◁◆▷▽,用户在台前看到的数字人都只是背后运营团队的产出-□••。例如哗哩哗哩上的许多数字人 UP 主=◇,=■★◆“皮套▪▷-••●”的背后还是真人在进行配音和互动•◆◁…☆。去年双十一开始▼◆■▷□,我们也注意到了有很多淘宝品牌旗舰店用到了数字人主播来进行带货◁◇■-。虽然这些数字人带货主播是 AI 合成▷○▼…,在动作◁●、嘴型上已无违和感可以实现 7*24 小时直播并智能生成播报视频流内容•▪◁★•,但互动体验仍较为初级▪◇-=▪□。
我们认为★-▷•◇,越是高阶的自动驾驶●▪•,就越是需要频繁△▷…、稳定•☆▪、高效的人车交互○=★▲▲。在 LO-L2时代▪◁•,由于自动驾驶只能完成一些基本的驾驶任务=★○,如车道保持◆-△▼、自适应巡航△□★△,因此驾驶员需要时刻关注交通状况○◇,并无太多精力关注人车交互☆•◆=•,智能座舱只需为驾驶员提供基本的导航▽▪▼◇◁、车辆监控▲△◇、娱乐交互即可◆-…。在高阶自动驾驶时代•●,驾驶员无需时刻将注意力放在驾驶本身-▽•,自动驾驶就可以完成大部分常规情景下的驾驶工作▽=★○,而智能座舱此时需要担负一则重任一一与驾驶员保持密切联系▲★▼-,以便在自动驾驶无法完成驾驶工作时☆●□•,驾驶员能够及时介入方向盘★◇,避免发生意外▪◆■•,而拟人…•==▽、立体□•、高度智能化的 HUD 甚至全息数字人◆▷,是这种场景下的有效交互方式▷○☆-●。相对于屏幕上的人工智能…■○△◇,全息数字人更加亲切○▽▽☆○★、灵动…★…,支持自定义外观▼…•▷▲□,可以吸引年轻用户■…▽☆▷:相对于从屏幕独立出来的蔚来 NOMI全息数字人更具科技感☆△◇◇◆,有机会在年轻用户群体中打开全新市场空间◁▷…。
⚫ 估算逻辑二◁★▷●•:智能座舱渗透率▲◁◁☆=▲。由于后装 HUD 比例很小□■▪▽,我们在此仅考虑前装市 场=★▲•▷。根据 IHS Markit 数据▪□,2022 年国内新车智能座舱渗透率 60%▽▼▷=,此后随着新能 源汽车渗透率提升○▽★○…,带动燃油车向智能化迈进▲△☆,2023-2025 年智能座舱渗透率有望 进一步提升至 66%/72%/76%◇•。
栩栩如生的智能座舱教字人△○◇•▷●,有望为驾驶者带来-▲▼“人人交互□•▼□•○”的体验•☆•-•,早先在肘来汽车上搭载的 NOMI 机器人一度成为蔚来品牌的当家卖点=▽-,NOMI 百变的表情和花样繁多的装饰周边让 NOMI机器人成功★-=□▷▼“出圈▼▷☆”★◇。我们认为●★▲,具有高度亲和力…▲△○★、智能水平足够高=▷••▷●.能帮助驾驶者完成或简单(如接电话◇◁…□、播放音乐) 或复杂(如导航○▼△、生活助理▲•▲-▷◇、汽车保养) 的任务■○☆•▼,是定义一个智能座舱数字人的核心要点○●★…◇◆。
2022年11月◁●■,ChatGPT一上线就迅速成为了AI界的◆▷▷■★“当红炸子鸡•●”•◇▪▽○•,2月内用户突破1 亿--◇▪-■,成为历史上用户增长第二快的应用▷□。这主要得益于其强大的语言生成能力和多样的应用场景••,ChatGPT 不仅能回答各种问题…▲■=◆,还能写剧本=•-▪、写小说-▽…-、写说明书▷△,甚至给代码纠错□…-△■。并且在这过程中▽○◇▼•,它表现出了非常高的=■▪“情商★••◁-☆”▼•☆△,能进行多轮对线日★-◆,OpenAI 宣布开放 ChatGPT和 whisper 的 API接口ChatGPT API是一个用于开发者的语言模型接口▪◆○,它可以让开发者使用 GPT 3-…□.5 Turbo 模型来生成自然的对话和文本☆▷●▲。ChatGPT API 的优势是它有持续的模型改进★▼,低廉的价格▲▽,和可选的专用容量▲=■。
汽车是 AI Agent 最具潜力的应用场景之一★☆△。车主在驾驶时◇■◁○▷,需要既快又准地对汽车进 行操作■★•▲,在座舱还未智能化的时代△★-○,这种操作依靠机械按钮★◁▽、操作杆进行□☆=◆◁,而未来的人 车交互愈发向中控屏幕集中•▲=△▪◇,传统的操作习惯就需要改变★▷。而 AI Agent 的能力则贴合了 这种需求□◆▽•▽:快速响应•△▪☆★、准确理解命令和无手操作=-◁◁•,而 AI 赋予的智能化可以将 Agent 的能 力进一步外延-…☆,这些抽象的能力具象到应用场景中■▼△,可以将 AI Agent 的能力总结为 5 个 层次…▽:辅助操作▪-●…◇、车身数据采集&可视化★-▷☆■、汽车服务(导航◁△★▽、保养◁□、保险等)▪△▽、生活助理•△▪…、 具身智能◁△▼。
⚫ 估算逻辑四■•:智能座舱数字人定价•◇◁。考虑到智能座舱数字人并非驾驶刚需•▼●◇,而是驾 乘体验升级的可选消费☆▼,同时□-■◇■,考虑到智能座舱数字人背后的研发成本较高●▽▷•■▪,我们 认为将月度订阅价定在 40-60 元/每月或 400-600 元/年比较合适☆◆…。
2)屏幕时代■☆●=◇。本世纪初□▪◇▷▲,随着液晶屏幕应用○▷☆▪,可显示内容成为座舱发展的重要一步-◇▽●=:随后软件应用开始蓬勃发展☆•▼☆,支持凯立德导航的中控车机成为一时的热门改装方案▷○▪▼▷▪;是否支持苹果 Carplay□◇▲○△•、百度 Carlife 是消费者选购车型时的重要考量因素□◇☆○;
4)大屏多屏时代◁…▲★◆。生成式 AI 进一步赋能人车交互◇●●◇▷■,点亮了车机的灵魂○••: 屏幕更多▼△▷、尺寸更大△▲,人车交互密度进一步加大◆-…◆;L2▪-•-□、L3 高阶自动驾驶方案日趋成熟■◆,自动驾驶与智能座舱进行深度祸合◆▷▷-,◆▼☆◆“智驾●▪”概念越来越近△○。
AGI 的快速进步一直是市场关注的焦点☆▷☆★•,今年以来维持着较高的市场人气★▷▽…◇,从算力●■•、游 戏●●、营销到医疗▲○○•、教育等◆•△□◆,市场一直在期待新的应用突破点▽☆■▪=▪。我们观察到…◆=☆★,随着造车新 势力销量逐月走高☆★-◆;高通发布最新骁龙 8 Gen 3=▷、骁龙 X Elite▷=◇=▷,边缘侧算力再创新高▲•、 数字人+AI 优化成熟•○==•◁,车载 AI 全息数字人有望成为○……“人—车—家●-□•◆-”三屏融合中的重要一 环-◇▲。
⚫ 估算逻辑一★▪□:乘用车市场增量◁▼。据公安部数据△▼■,2023 年 9 月中国汽车保有量将超 过 3◆▽△□▷▲.3 亿辆☆●,2025 年或突破 4 亿辆•-△◆▪;根据观研报告网数据预测▲•★▲◁,2023-2025 年我国 乘用车销量为 2389/2437/2485 万辆◁▽▷▷●。
全息空中显示(AerialHoloDisplay★▷□,AID )通过图像单元生成的信息(数字人-▼○▲○★、行车信息★◆☆□、导航等) 由离轴反射系统经过风挡 (也可不经风挡) 投射于驾驶员前方◇•◇。AID 利用微结构光场重构技术…□☆•,把物体离散成高分辨率的空间光斑点阵▲▼▲…,通过光的衍射传播☆▲☆•、干涉迭加及光场的复振幅调控◆=…▪,将离散的光斑点阵无损地重构在空气中▪▷,无需任何介质的散射□▷◁▷,即可观测到高保真度的图像☆▽,从而实现无介质成像△▪○▲▪◆。AID 技术的成熟◇★,更是为数字人三维交互提供了优质条件•◁•◁。