Canalys 今天 “AI 手机”进行了分析,认为最近出现的大语言模型(LLM)驱动了相关手机行业,预计 2024 年全球将出货 6000 万部 AI 手机,超过同年“AI PC”的 5300 万台出货量。
Canalys 认为“AI 手机”是一个“广泛且模糊”的概念,不过相对于“AI PC”概念,“AI Phone”实际上更贴近消费者,当下苹果、华为、vivo、小米等厂商已经在自家手机中大量应用设备端 AI,从而提升成像质量、电池寿命和打字体验。
▲ 图源 Canalys 官方公众号(下同)
不过 Canalys 同时提到,在生成式 AI 模型爆发的当下相关手机还应“整合 AI 模型”,具体应该满足以下标准:
最低要求
- SoC 应包含能够加速 AI 任务的专用单元。(例如,高通 Hexagon、联发科 APU、Google TPU)
- 智能手机应能够在端侧运行 LLM(例如,Google Gemini、三星 Gauss)和其他生成式 AI 模型(例如,Stable Diffusion)。
- 端侧 LLM 的推理性能应快于成人的平均阅读速度,相当于 10 token / s。(基于 LLaMA-2 7B, 或同等水平)
- 使用端侧 AI 生成图像的时间应小于 2 秒。(基于 Stable Diffusion v1.5,20 步,512*512 分辨率,或同等水平)
可选要求
- 设备出厂时应预装 LLM(例如,Google Gemini, 三星 Gauss)。
- 为第三方开发者提供生成式 AI 相关的 API 和 SDK,以方便开发者将生成式 AI 驱动的功能集成于端侧移动应用中。
- 在设备上预装由厂商第一方开发的生成式 AI 功能,并且保证其可以在端侧高效运行。
Canalys 表示,当前智能手机拥有“最庞大的装机量”,到今年年底全球手机总量预计将达到 50 亿部,虽然其中预计只有 5% 为 AI 手机,但已经足够加速 AI 应用的普及与个性化,并有助于开发者社区创造多样化的第三方 AI 应用。
Canalys 同时声称,根据对早期“AI 手机”的观察,相关手机的功能性主要包含以下十点:
- 硬件优化:AI 可以根据用户行为或场景为操作系统提供帮助以优化电池寿命或相机成像。
- 跨设备自动化:通过利用智能手机传感器获得的数据,AI 将能够理解使用场景,并生成跨设备自动化任务。
- 图像和视频编辑:除了消除物体和智能抠像之外,用户还可以利用 AI 驱动的功能获得更心仪的照片以及更好的视频编辑体验,如自动颜色校正、背景替换和艺术风格化转换等。
- 社交媒体内容创作:AI 可以根据视频或照片撰写帖文,帮助用户维持社交活跃度。
- 自动电话接听:AI 将根据用户的语音语调生成更自然的声音用于自动电话接听。AI 能够更好地理解拨打方的意思,提高对话质量。
- 自动回复:AI 将利用学习到的用户行为模式,在消息应用程序中生成自然的回复信息,以供用户选择。
- 视频搜索:AI 可以帮助用户理解视频内容,以便在视频中搜索特定信息。例如,通过搜索对话语句关键词在视频中定位到特定场景。
- 端侧 AI 驱动的聊天机器人和搜索:AI 将有助于更好地理解用户通过自然语言进行的搜索查询,并改进搜索结果。端侧聊天机器人能够理解和记录用户数据和历史对话,同时确保用户隐私受到保护。
- 内容摘要:AI 将能够从各种格式(例如,音频、视频、电子邮件附件)的长篇内容提取内容,生成简洁的摘要,帮助用户更方便地在智能手机上阅读这些内容。
- 日程助理:AI 将利用来自横跨多个应用程序的数据源,自动创建和管理日历日程,同时确保用户数据受到保护。
Canalys 强调,AI 手机成功的关键在于“能否扩大智能手机的应用场景并搭建 AI 原生应用”,第三方应用往往能决定用户如何使用手机,因此智能手机厂商必须与开发者社区紧密合作,以设备端 AI 优势获得未来的竞争优势。