消费电子:端侧AI风起云涌,眼镜终端系最佳落地场景之一!
投资要点
完美的AI助手,终极的数字社交。“端侧AI”是指AI可以直接在移动设备上处理数据,无需连接到服务器或云端,能够在用户设备本地完成复杂的推理和决策。端侧AI在对硬件提出更高要求的同时,也对其算力、能效以及软硬件协同等方面提出新的挑战。眼镜系端侧AI最佳落地场景之一,相比手机、电脑等传统设备,以下原因使其成为AI的最佳载体:(1)便携性:眼镜轻便易携,可随时随地与AI交互,不受时间和空间的限制。(2)人体贴合性:眼镜与人体高度贴合,可提供更自然、更舒适的交互体验。(3)可扩展性:眼镜可集成摄像头、麦克风、扬声器等传感器,满足视、听、说、感知等多维度需求。通过深度整合多模态大模型,AI眼镜不仅能实现自然流畅的AI语音交互,还能利用眼镜上的摄像头,让AI通过视觉感知周围环境,基于真实世界进行AI聊天问答、物体识别以及拍照答题等体验。眼镜可以看用户所看,听用户所听,因此可以成为完美的AI助手,因为其知道用户正在做什么事情。眼镜终端作为数字社交工具的前景:(1)无缝社交体验:智能眼镜可以让用户在不中断当前活动的情况下进行社交互动,如视频通话、发送消息等。这种无缝的社交体验可以让人与人之间的联系更加紧密。(2)共享视角与体验:通过智能眼镜的摄像头和AR技术,用户可以与他人分享自己的视角和经历,增加社交互动的真实感和趣味性。例如,在旅游时,用户可以与远方的朋友实时分享所见所闻。(3)虚拟聚会与活动:未来,智能眼镜可能会成为参加虚拟聚会、演唱会等活动的必备工具,用户可以在家中就能身临其境地参与各种社交活动。
音频/摄像头/AR显示三大要素组合,构建国内眼镜终端三大类别。从用户角度看,国内AI眼镜的基本功能大致包括语音识别、音视频播放录制以及AI调用(如语音交互、翻译、查询天气交通信息等),而厂商在功能设计上主要围绕"音频"、"摄像头"以及"AR显示"三大要素进行组合,这些功能决定了产品的价格区间,通常在500元至5,000元之间,功能越丰富,售价越高。(1)音频眼镜(听歌+通话):以音频功能为核心,省略摄像头等视觉交互功能。这类眼镜支持语音通话、听音乐等基础音频功能,代表性产品包括小米生态链企业蜂巢科技推出的界环AI音频眼镜以及华为的智能眼镜。此类眼镜,厂商仅需在镜框内增加麦克风阵列、耳机、电池和处理器等组件即可打造成型,这类眼镜的功能主要依赖语音识别和TTS(文本转语音)技术,无需图像处理模块,价格便宜。(2)视频眼镜(拍照+录像):在音频功能基础上增加摄像头模块和部分AI功能,在具备拍照和录像功能的基础上,再给用户带来基础性AI体验,如Ray-BanMeta。此类眼镜相较于音频眼镜增加摄像头模块,技术难度提升不算巨大,但目前已属于最主流、销量最大品类。(3)AR+AI眼镜(音频+视频+AR+AI):在音频和摄像头的基础上,加入AR体验,例如Rokid发布的RokidGlasses,不仅支持音/视频功能,还可以通过摄像头和AR技术实现实时翻译和导航等相对复杂功能。另外还有百度推出的小度AI眼镜,以及星纪魅族的StarVAir2AR智能眼镜等产品。此类眼镜需在硬件中引入光学模块以支持AR显示,这不仅要求更高的硬件集成度,也面临功耗和散热问题的挑战。
投资建议:智能可穿戴设备的需求增长,以及生成式人工智能大模型的崛起,正在将AI音频眼镜推向更广的市场。在短期内AR眼镜用户画像较为模糊背景下,智能音频眼镜以替代耳机功能为切入口,以眼镜(矫正视力/装饰)为载体,搭配AI提高体验与卖点,有望开辟音频新赛道。建议关注进入各产品供应链或有相关技术储备厂商。如:
光学:水晶光电、歌尔股份、欧菲光、韦尔股份;
组装:歌尔股份、亿道信息、天健股份、龙旗科技、佳禾智能等;
存储:兆易创新;
摄像头:韦尔股份、舜宇光学科技等;
SoC:恒玄科技、瑞芯微、中科蓝讯、炬芯科技等;
结构件:杰美特、长盈精密;
屏幕:京东方-A、华灿光电、JBD(未上市);
终端厂:Rokid(未上市)、雷鸟创新(未上市)、Xreal(未上市)、影目(未上市)。
风险提示:技术演进轨道与产业生态尚未定型风险;对前瞻重点技术产业化进程敏感性不强风险;内容生态建设不及预期风险;下游需求不及预期风险。