gpt是什么?
gpt是一名人工智能语言模型,也被称为AI助手。是由计算机程序编写而成,可以模拟人类的语言交流,为用户提供各种服务和帮助。可以回答用户的问题、提供信息、执行任务等,帮助用户解决各种问题。
ChatPT是一种基于人工智能技术的聊天机器人,它是由OpenAI公司开发的一种自然语言处理模型。ChatGPT的全称是“Generative Pre-trained Transformer”,它是一种基于Transformer模型的自然语言处理模型,可以用于生成自然语言文本、回答问题、聊天等多种任务。
ChatGPT是一种预训练模型,它是通过在大规模语料库上进行无监督学习而得到的。在预训练阶段,ChatGPT可以学习到自然语言的语法、语义和上下文等信息,从而可以生成自然流畅的文本。在应用阶段,ChatGPT可以通过微调等方式对特定任务进行优化,从而可以用于生成自然语言文本、回答问题、聊天等多种任务。
ChatGPT的优点在于它可以生成自然流畅的文本,可以进行多轮对话,并且可以根据上下文进行理解和回答。它可以用于多种应用场景,比如智能客服、智能问答、智能助手等。同时,ChatGPT还可以不断地通过学习和优化来提高自己的性能和效果。
各位老司机,平常你们喜欢用车载自带的车机,还是手机互联?现在中国各大汽车厂商除了内卷电动车续航之外,还内卷汽车智能化。现在有大家熟悉的包括华为、百度、科大讯飞和阿里等等大厂加持。
不过要说人工智能,谁才是顶流天花板?当然是从上年火到现在的ChatGPT了。这个隶属于微软旗下的OpenAI公司,从此也坐上火箭市值一直飙升。
不过之前ChatGPT的应用大多数还停留在网页人工智能对话,写写文案。但如果把他放到汽车里面,会有怎么样的效果呢?
这方面奔驰抢先去喝头啖汤了。近日梅赛德斯-奔驰和微软共同宣布,将ChatGPT功能添加到美国的奔驰汽车车机里面。 ChatGPT是微软的“生成式人工智能”软件,可以进行与真实人类对话类似的交互。
现在的梅赛德斯-奔驰汽车,车载系统是MBUX,MBUX系统首次于2018年在梅赛德斯-奔驰A级车上亮相,后来逐渐应用于公司旗下的其他车型。MBUX系统以其智能化、高度个性化和功能强大的特点而备受关注。已经具备语音命令功能,让驾驶员使用短语“嘿,Mercedes”,然后下达简短的命令来进行诸如调节车内温度、寻找导航目的地或拨打电话等操作。
微软表示,ChatGPT将使这些语音命令更加流畅自然,并可能启用其他功能。该系统不仅仅只回应简单的命令,还能进行更加自然的交流。该系统将能够记住正在讨论的内容,并与驾驶员或车内乘客进行反复对话。有了ChatGPT,该系统将能够回应更广泛的请求,包括与汽车或驾驶员无关的请求。例如,驾驶员可以问一个快速食谱,或者什么时候去旅行最好?
ChatGPT系统还可以与其他应用程序交互,处理诸如预定餐厅、购买**票等事务。
在互联网上,ChatGPT已用于进行研究和撰写论文、选择股票,甚至为情感危机的人对话开导。
在过去的十年左右的时间里,包括梅赛德斯在内的汽车制造商已经为其汽车创建了越来越复杂的语音命令系统。它们被吹捧为比按钮或触摸屏更安全,因为驾驶员不必看开从而看得离目标越近。虽然一些研究表明,使用语音命令所需的心理处理仍然会分散注意力。
不过这些都不是重点,重点是OPENAi的创始人也曾经表示,AI其实也是非常可怕的。如果AI加入到汽车当中,全面接管汽车的其他功能,那个后果是无法想象的。
在此之前,苹果在全球开发者大会上发布了新一代CarPlay车机交互系统,用户将可个性化定制自己的仪表盘界面,如传统三圆仪表、双圆+中央信息显示屏等布局。路虎、保时捷、日产、福特、奥迪等多个汽车品牌进行深度合作,每一个品牌都有不同的设计。当然,车机的人工智能对话,就是基于苹果手机的Siri系统。
本文来自易车号作者五号车论,版权归作者所有,任何形式转载请联系作者。内容仅代表作者观点,与易车无关
该程序不能直接生成三轴车床的程序。
因为三轴车床的编程是一个复杂且需要专业知识的领域,需要考虑工件的形状、材料、刀具选择、切削速度、进给速度等因素。然而,ChatGPT可以通过自然语言处理技术,帮助您获取与三轴车床编程相关的信息和知识。
“在 AI 技术生态上,生成式大模型已成为自动驾驶系统进化的关键,基于 Transformer 大模型训练的感知、认知算法,将逐步在车端进行落地部署。”
在最新的毫末 AI DAY 上,毫末智行董事长张凯给出了这一判断,并基于这一判断发布业内首个自动驾驶生成式大模型 DriveGPT,中文名“雪湖·海若”。
自去年年末以来, GPT 的热度一直高涨不下,尤其是 ChatGPT 的大火更是引发全行业关注。此前,GPT 多应用于文本生成、代码生成或是搜索领域,但由于缺乏数据支撑,GPT 在自动驾驶行业这一垂类的应用并不高。
截至目前,业内也仅有毫末一家率先将 GPT 应用到自动驾驶领域,即 DriveGPT 雪湖·海若。
DriveGPT 能为智能驾驶做什么?GPT 的全称是生成式预训练 Transformer 模型,本质上是在求解下一个词出现的概率。即根据输入的前序文本,模型会输出可能出现的下一个字的几率分布,再从中取样出几率较高的字。如此循环往复,直到完整地写完下文。
据官方介绍,DriveGPT 雪湖·海若的底层模型采用 GPT(Generative Pre-trained Transformer)生成式预训练大模型,与 ChatGPT 使用自然语言进行输入与输出不同,DriveGPT 输入是感知融合后的文本序列,输出是自动驾驶场景文本序列,即将自动驾驶场景 Token 化,形成“Drive Language”。
Drive Language 基于毫末的 CSS 场景库理论,将驾驶空间进行离散化处理,每一个 Token 都表征场景的一小部分,相当于许多个可能在未来出现的平行宇宙,最终完成自车的决策规控、障碍物预测以及决策逻辑链的输出等任务。截至目前,毫末从真实驾驶场景库中提取的token序列,规模达到 50 万个。
有了 Drive Language,毫末就可以用人类驾驶的数据对模型进行预训练。
首先,在预训练阶段通过引入量产驾驶数据,训练初始模型,再通过引入驾驶接管 Clips 数据完成反馈模型(Reward Model)的训练,然后再通过强化学习的方式,使用反馈模型去不断优化迭代初始模型,形成对自动驾驶认知决策模型的持续优化。
同时,DriveGPT 雪湖·海若会根据输入端的提示语以及毫末 CSS 自动驾驶场景库的决策样本去训练模型,让模型学习推理关系,从而将完整驾驶策略拆分为自动驾驶场景的动态识别过程,完成可理解、可解释的推理逻辑链生成。
毫末智行 CEO 顾维灏表示,毫末 DriveGPT 雪湖·海若通过引入驾驶数据建立 RLHF(人类反馈强化学习)技术,对自动驾驶认知决策模型进行持续优化。据毫末方面的说法,在 RLHF 的加持下,Hard Case 通过率提升了 48%。
目前,毫末 DriveGPT 雪湖·海若实现了模型架构与参数规模的升级,参数规模达 1200 亿,预训练阶段引入 4000 万公里量产车驾驶数据,RLHF 阶段引入 5 万段人工精选的困难场景接管 Clips。
毫末方面表示,DriveGPT雪湖·海若现阶段主要用于解决自动驾驶的认知决策问题。“在感知到了周围的世界之后,怎么样把车开得更安全,把车开得更顺滑,怎么样跟周围的交通参与者互相博弈。”顾维灏说道。
毫末判断,DriveGPT雪湖·海若还将在城市 NOH、智能陪练、驾驶捷径推荐、脱困场景中得到应用,最终目标是要实现端到端自动驾驶
毫末在 AI DAY 上宣布,DriveGPT雪湖·海若将在即将量产上市的新摩卡DHT-PHEV首发。
毫末基于GPT技术的探索,毫末衍生出服务于业界的能力和新的商业模式,即向业界开放DriveGPT的能力,4月11日开放单帧自动标注服务,可降低标注成本,之后还将陆续开放驾驶行为验证、困难场景脱困等功能。
DriveGPT 背后的支持事实上,DriveGPT 雪湖·海若的训练和落地,离不开算力的支持。
今年 1 月,毫末和火山引擎共同发布了其自建智算中心“毫末雪湖·绿洲 MANA OASIS”。毫末表示,OASIS 的算力高达 67 亿亿次/秒,存储带宽 2T /秒,通信带宽达到 800G /秒。
不过,只有算力还不够,还需要训练和推理框架的支持,由此毫末进行了三方面升级——
一是训练稳定性优化。毫末在大模型训练框架的基础上,与火山引擎共同建立了全套训练保障框架,可以通过集群调度器实时获取服务器异常,将异常节点从训练 Task group 中删除,再结合CheckPoint 功能,利用 VePFS 高性能存储和 RDMA 网络高效分发,以保障 DriveGPT雪湖·海若大模型训练的稳定性。
二是弹性调度资源的升级。毫末构建了一个大模型持续学习系统,数据以动态数据流的形式结合增量学习,持续不断地将量产回传和筛选的存量数据,传入认知和感知 Pretrain 大模型。
三是吞吐效率的升级。在 Transformer 的大矩阵计算上,毫末通过对内外循环的数据拆分,尽量保持数据在 SRAM 中提升计算的效率;在传统的训练框架中,通过引入火山引擎提供的 Logo核心算子库实现融合,端到端吞吐提升 84%。
另外,毫末表示,自动驾驶数据智能体系MANA架构已迎来全线升级。截至2023年4月, MANA 学习时长超 56 万小时,相当于人类司机 68 万年。
在 MANA 发布迭代一年后,在本次 AI DAY 也迎来升级,具体包括:
首先,MANA 感知和认知相关大模型能力统一整合到 DriveGPT 雪湖·海若中;其次,MANA计算基础服务针对大模型训练在参数规模、稳定性和效率方面做了专项优化,并集成到 OASIS 中;第三,增加了使用NeRF技术的数据合成服务,降低 Corner Case 数据的获取成本;最后,针对多种芯片和多种车型的快速交付难题优化了异构部署工具和车型适配工具。在视觉感知能力上,毫末对视觉自监督大模型做了一次架构升级,将预测环境的三维结构,速度场和纹理分布融合到一个训练目标里面,强迫模型练好内功,使其能从容应对各种具体任务。目前毫末视觉自监督大模型的数据集超过 400 万 Clips,感知性能提升 20%。
顾维灏举例称,在泊车场景下,毫末将鱼眼相机也引入到视觉 BEV 的感知框架当中,鱼眼图像通过 2D backbone 提取出视觉特征,经过空间转换映射至 BEV 空间,并在该空间下对于障碍物的轮廓边界进行识别和测量,目前可做到在 15 米范围内达测量精度 30cm,2 米内精度高于 10cm。
除了用自监督大模型练内功,毫末还公开了在纯视觉三维重建方面的一些进展。
毫末对 NeRF 做了升级,将视觉感知结果转化为可用于 BEV 模型训练的带 3D 标注的真值数据,目前可以做到重建误差小于 10cm。
单趟重建有时会受到遮挡的影响,不能完整地还原三维空间,因此毫末尝试了多趟重建的方式——即将同一地点不同车辆在不同时间经过的数据合并做多趟重建,由此提升场景还原度,重建效率可提升 5 倍。
重建之后,MANA 可以编辑场景合成难以收集的 Corner Case。毫末表示,近期训练了一个可以在静态场景做虚拟动态物体编辑的模型,可以控制虚拟物体在场景中按照设定的轨迹运动,由此合成各种 hardcase,例如近距离回车,行人、电动车交互行为等。
2023年将是智驾产品大考之年“2023 年智驾产品进入全线爆发期。”毫末智行董事长张凯在活动上表示。
张凯判断,城市导航辅助驾驶产将在 2023 年将围绕量产上车发力,主要玩家的城市导航辅助驾驶产品进入到真实用户覆盖和多城市落地的比拼。
其次,行泊一体和末端物流自动配送产业商业化将成为自动驾驶公司深耕的重点。在乘用车领域,搭载行泊一体功能的智驾产品将迎来前装量产潮;在末端物流自动配送领域,末端物流自动配送车在商超、快递等场景迎来爆发,2023 年将在这些场景实现可持续商业化闭环。
在 AI DAY 上,毫末表示其城市 NOH 已在北京、保定、上海等城市开启泛化测试,即将量产上车。张凯表示,到2024 年,毫末城市 NOH 将有序落地 100 城。
一年之内,从三座城市扩张至百城,毫末给出的目标可以说十分激进。
截至目前,毫末三代乘用车产品搭载车型近 20 款,毫末辅助驾驶用户行驶里程突破4000万公里,HPilot20 日均里程使用率 126%。
毫末智行透露,目前已与 3 家主机厂(包括长城)签署定点合同,相关项目正在交付中。
结合毫末往届 AI DAY 的动态来看,从发布中国首个数据智能体系 MANA,到建设智算中心雪湖·绿洲,再在其基础上训练出参数规模达 1200 亿作为 DriveGPT 雪湖·海若模型,毫末的闭环思维始终贯彻其技术始末,并逐渐形成数据驱动的闭环。
正如毫末所言,2023 年将是智能驾驶冲刺之年、大考之年。这对毫末来说,这也是长久技术布局走向落地应用的关键时期;毕竟,毫末要在 2025 年实现城市 NOH 落地 100 城,这并不是一个简单的事情。
本文来自易车号作者钛AUTO,版权归作者所有,任何形式转载请联系作者。内容仅代表作者观点,与易车无关
0条评论