原生JS+SSML实战:低门槛构建带情绪动作的AI陪伴智能体
针对AI应用缺乏情绪价值的痛点,本文提供一份原生JS接入魔珐星云SDK的实战指南,详解如何利用SSML与动作指令控制数字人,低门槛构建陪伴型智能体。
本文分享如何基于魔珐星云SDK与Vue3,将传统机械交互的政务大屏和车机升级为具有拟人服务的具身智能体,重点拆解低延迟端侧渲染的集成与打通步骤。
在近期的政务大屏和智能座舱项目中,我们发现传统的屏幕交互模式正面临严峻的体验瓶颈。作为屏幕集成开发者,我们亟需解决以下核心挑战:

以下是我们团队在工程化落地(Vue 3 项目)中,基于官方 SDK 串联语音识别(ASR)、大语言模型(LLM)与星云表达引擎的核心开发步骤。
首先在工程 HTML 文件中引入底层脚本:
<script src="https://media.xingyun3d.com/xingyun3d/general/litesdk/xmovAvatar@latest.js"></script>随后,在服务层构建配置对象,并向平台发起连接与回调绑定:
// 1. Auth and gateway config
const config = {
appId: 'YOUR_APP_ID',
appSecret: 'YOUR_APP_SECRET'
}
// 2. UI callbacks (subtitles, engine state)
const callbacks = {
onSubtitleOn: (text: string) => {
console.log('subtitle sync:', text)
},
onSubtitleOff: () => {
console.log('subtitle off')
},
onStateChange: (state: string) => {
console.log('engine state:', state)
}
}
// 3. Connect to Nebula
const avatar = await avatarService.connect(config, callbacks)为了实现自然对话,我们需要捕获用户的语音指令,并交由大语言模型处理。工程中封装了 useAsr 钩子函数获取语音,并通过状态管理(appStore)发起 LLM 请求:
// ASR: start listening
const { start, stop, asrText } = useAsr(config, vadTime)
start()
// Stop and read transcript
stop()
console.log('ASR text:', asrText.value)
// Send user text to LLM (e.g. route or POI question)
const answer = await appStore.sendToLLM(asrText.value)
console.log('LLM reply:', answer)获取大模型的返回文本后,调用星云引擎的驱动接口让数字人进行播报。同时,为了增强智能体在不同业务节点下的「生命感」,我们封装了专属的状态控制方法:
// Drive avatar (SSML / stream flags as supported)
avatar.instance.speak(answer, true, false)
// --- State helpers ---
// 1. Idle when no user (ambient motion)
idle(avatar: any): void {
avatar.idle()
}
// 2. Idle between conversational turns
interactiveIdle(avatar: any): void {
avatar.interactiveidle()
}
// 3. Listening pose while ASR is active
listen(avatar: any): void {
avatar.listen()
}在具身智能时代,物理屏幕不再是单向的信息展示容器,而是 24 小时在岗的最佳智能服务载体。通过本次 Vue 3 与魔珐星云 SDK 的集成实战,我们成功避开了传统数字人「高延迟、高并发成本」的算力陷阱,利用极低带宽的参数流技术,在普通车机和政务终端芯片上跑通了自然的交互链路。
对于屏幕方案商与集成团队而言,掌握这套低成本的 AI 屏幕改造方案,意味着打破了单纯「卖硬件」的微薄利润困局,正式切入高附加值的「场景化 AI 服务」赛道。推荐各位开发者直接前往魔珐星云控制台获取 API 密钥,亲自测试这套端侧渲染引擎的性能。
魔珐星云,不止是数字人,让 AI 从会思考,走向能表达、会交流。