微信扫码
与创始人交个朋友
我要投稿
(一) Al智能眼镜的关键技术特征
Al智能眼镜的关键技术特征涵盖了基础服务、独立生态、融合感知、多模态交互、超级 智能体、端云协同、隐私安全等。
1、基础服务
Al 智能眼镜,离不开眼镜的基础功能。 视觉要求,无论是近视镜片、老花镜片还是太阳镜片,都是用于辅助人的视觉效果, 这是眼镜的主要属性。
时尚要求,眼镜附加属性应该具备的美观、轻便、舒适等特性重 量 要 求 , 眼 镜 是 一 款 长 时 问 使 用 的 产 品 , 重 量 在 其 中 是 很 重 要 的 因 素 , 要 在 眼 镜 上嵌 入视觉、音频效果,势必会给眼镜增重,如何合理地控制重量则至关重要。
外观设计要求,AI 智能眼镜可以沿用已经成熟的眼镜设计方案,如RayBan Meta智能眼 镜外观设计就采用了Ra yBan最畅销的Wayfar er款式。也可以设计Al 智能眼镜专用款式。
2 、独立生态
眼镜作为独立的个体,其服务功能是全天候的,大多数佩戴眼镜的人除了休息的时候, 几乎不会摘下眼镜,这就要求眼镜需要具备长时间工作的属性。
而Al智能眼镜作为眼镜发展的迭代品,也应该具备这种全天候的能力,这对于Al 智能眼 镜的电源管理和系统管理都有很高的要求,同时对Al 智能眼镜的独立生态也有很高要求。
AI 智能眼镜作为独立的个体,在功能上可以是手机、平板或电脑的延伸设备,但因其长 时间工作的属性,应该具备独立的操作系统,具备独立的算力支持,来提供更方便、快捷且 随时随地的智能服务。
3、融合感知
人类在获取信息或交互时,第一步习惯于基于意图获取对应的视觉信息,眼镜作为最贴 近人类视觉感知的设备,拥有计算机视觉的Al智能眼镜具备感知能力,有助于深入了解用户 的意图,提供更精准贴切的智能服务。
在形态上,一旦Al 智能眼镜具备独立的生态环境,便可以作为物联网生态中的一环接入 其中,而依据Al 智能眼镜的智能属性和交互属性,更容易确认用户意圈。
基于意图进行环境 感知,实现场景理解,借助空间定位和物体识别,则可以作为物联网生态中的控制中枢,利 用自身硬件基础或利用物联网生态中硬件基础实现虛实结合的智能调控等功能。
4 、多模态交互
Al智能眼镜有多种交互方式,如触摸交互、语音交互、显示交互、手势和眼动交互。
现 阶 段 的 A l 智 能 眼 镜 主要 以 触 摸 和 语 音 交 互 为 主, 当 接 入 摄 像 头 和 算 法 芯 片 后 , 可 实 现 手势交互,下一步增加眼镜上的摄像头数量,可实现眼动追踪,再加上显示模块,则是Al智 能眼镜发展的完全体,也是现阶段依日在探索完善的AR眼镜。
5 、超级智能体
超级智能体是一种通用问题解决器,基于大型语言模型构建,具备学习、推理、决策和 执行等能力,可解决工具、感知、记忆、规划等问题。
• 工具--- 超级智能体可通过使用工具来解决问题。数字层面的工具,如计算器、搜索引擎、 数据库查询等;物理层面的工具,如调用音腔,实现声音的播放,调用摄像头,实现图像 的拍摄等。
• 感知--- 超级智能体可通过摄像头、传感器或其他感知硬件来观测环境,基于环境的状态和 变化,实现规划决策等功能。如通过摄像头拍摄,实现实时导航、路牌识别等功能。
• 记忆--- 超级智能体具备有效的存储机制,用于存储内置的知识库以及通过感知元件对外界 环境的观察,知识库用手制定有效的决策,外界的观察用于前后历史动作的连贯。如会议 记录并整理会议文档等。
•规划--- 超级智能体具备基手目标的推理和规划能力,将复杂问题拆分成简单的子任务,逐 步执行任务流程,并对任务流程进行审查思考,从而在面对复杂挑战时做出恰当的应对第 路。如实现工作安排、出行安排、会议安排等规划内容。
6、端云协同
• 云侧 : 主要从终端采集感知到的信息,包括声音、视频、图像等数据通过网络传输到云 中心进行数据处理,并将最终结果通过网络星现。
云侧的优势是资源高度集中,存储和 算力都十分强大,足以应对超大量级的训练数据,且训练出的模型具有很高通用性。
劣 势是不具备实时性,且有很高的滞后性,基于当下任务产生的数据训练出的模型并不能 及时解决当下的问题,且受制于网络的限制,无论是数据交互还是模型调用也会有很大 的延时,在隐私安全上还会有一定的风险,而对于构建云中心高性能计算系统来说,训 练和使用成本也相对高。
•端侧: 指直接在终端对采集到的数据进行人工智能算法上的处理,而无需发送到云端或 服务器。端侧的优势在于可以第一时问处理得到的信息,加快了系统响应的速度,且因 为无需上传数据,其隐私性和安全性也很高。
在数据处理上,端侧计算能高效地筛选有 效信息进行处理,减轻网络带竞负担的同时也缓解对云端中心数据存储的压力。
且相对 来说,端侧A1的成本较低。而端侧Al 也有很大的局限性,在算力上,相比于云侧,端侧 A1只能处理相对低量级的模型和数据,且对存储、芯片传输能力、电池续航和功耗散热 也有很大的要求。
• 端云协同: 目前最合理的方案是端云协同,端侧侧重感知执行,可解决一些日常化、简 单的人工智能处理任务;云侧侧重规划决策,可定期收集端侧提供的数据,训练优化模 型,并对端侧A!进行迭代更新。整体上,端侧AI可当作是云侧A!的简化版,满足用户日 常基本需求。
7 、隐私安全
无论是云侧Al 还是端侧Al,人工智能应用的落地势必伴随着引发的安全问题。人工智能 因其脆弱性、不稳定性、不可解释性、不可判定性、不可推论性等特点,在与经济社会深度 融合应用的过程中,板易引发国家、社会、企业和个人等层面的安全风险。
(二 ) AI 智 能 眼 镜 发 展 进 度 与 分 类
1 、 Al 智 能 眼 镜 发 展 分 类
目前A1智能眼镜的发展有 三个阶段,分别为无摄像头智能眼镜,带摄像头智能眼镜和带 显示屏智能眼镜。
目前无摄像头智能眼镜和带摄像头智能眼镜发展成熟,工艺成熟,市场上 已经存在成熟的产品,而带显示屏智能眼镜也有产品出现,但需要突破一些技术工艺。
2、智能眼镜功能对比
(三 ) 带 摄 像 头 AI 智 能 眼 镜 方 案
带摄像头AI 智能眼镜方案中,硬件的核心是SOC。 SOC是指片上系统芯片,即将多个电子组件集成到单一芯片上,以提供完整功能系统所 需的所有电子电路。
S O C 可 分 为 两 种 ,一 种 是 在M C U 的 基 础 上发 展 的 S O C ,为 M C U 级 S O C ,该 S O C 主 要 以 MCU内核为控制中心,添加特定的功能模块如蓝牙模块、音频模块等形成特定类型SOC,如 恒玄BES2500YP芯片。
另一种SOC是在CPU的基础上发展的SOC,为系统级SOC,该SOC以 CPU为中央控制单元,添加如GPU、DSP、ISP等模块用于实现特定功能,如高通的AR 1 Ge n 1芯片。
1、MCU级别SOC
MCU级SOC结构图
2 、系 统 级S O C
系统级SOC结构图
3、带摄像头智能眼镜方案
带摄像头Al智能眼镜目前有三种方案:系统级SOC方案、MCU级SOC+ISP 方案以及 SOC+MCU方案,其中系统级SOC方案集成度较高,功能较多,内置支持拍摄功能的1SP模 块。
MCU级别SOC+ISP方案集成度较低,需外接SP 芯片实现拍摄功能。SOC+MCU方案适 用性广,兼顾低功耗和高功耗应用,可通过系统调度有效控制续航时间。
带摄像头智能眼镜方案
(1) 系統級SOC方案
系统级SOC方案中,系统 级SOC芯片集成度较高,可支 持功能较多,以SOC芯片为主 要控制中枢,所有功能包括音 频、视频、拍摄、无线通讯 等,都基手SOC的开展,方案 成熟。
系统级SOC方案逻辑框图
(2) MCUBSOC方案+ISP
MCU级SOC方案,MCU级 S OC集成度較低,可提供的功 能较少,以MCU级SOC芯片为 主要控制中枢,將Al智能眼鏡 的功能划分模块,依据每个模 块添加外接芯片实现相应功 能,如实现拍摄功能,需外接 ISP芯片实现。该方案功耗低, 成本低,只是目前仍需完善。
M C U 级S O C 方 案 逻 辑 框 图
(3) SOC+MCU方案
SOC+MCU 方案,兼陋低 功耗和高性能,以SOC以及 MCU芯片为主要控制核心,依 据使用场景,MCU用于低功耗 应用,SOC用手高功耗应用, 利 用 系 统 调 度 ,可 有 效 平 衡 在 低功耗以及高功耗下的电源管 理,适用性广。
SOC+MCU 方案逻辑框图
4 、Al智能眼镜方案能力对比
(四)带摄像头A/智能眼镜基本功能和结构
带摄像头的AI 眼镜主要集成了蓝牙、眼镜、相机等硬件的功能,其基本功能 主要由音频 和视频的功能组成,且因其眼镜的结构形式,兼顾辅助视觉效果。
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-03-30
2024-05-09
2024-07-07
2024-07-01
2024-07-23
2024-06-24
2024-06-08
2024-06-05
2024-06-21
2024-07-11
2024-11-12
2024-11-11
2024-10-29
2024-10-22
2024-10-18
2024-10-16
2024-10-15
2024-10-10