AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


将小爱音箱接入 ChatGPT 和豆包,改造成你的专属语音助手
发布日期:2024-06-05 08:30:50 浏览次数: 3765 来源:GitHubStore


项目简介


在这个数字化的世界里,家已不仅仅是一个居住的地方,而是我们数字生活的延伸。

MiGPT 通过将小爱音箱、米家智能设备,与 ChatGPT 的理解能力完美融合,让你的智能家居更懂你。

MiGPT 不仅仅是关于设备自动化,而是关于:打造一个懂你、有温度、与你共同进化的家。

未来,你的每个智能家居设备,从灯泡、插座,到扫地机器人、电视等,

都可以作为一个个独立的智能体 (Agent),更智能、更贴心的响应你的指令。

这些独立的智能体,也可以彼此感知,彼此配合,构成一个更强大的协作网络。

而小爱音箱就像是你的智能家居专属管家,全心全意为你服务,释放智能家居真正的潜力。

✨ 项目亮点

  • ? LLM 回答。想象一下,你的小爱音箱变身聊天高手,可以使用 ChatGPT 等大模型来回答你的问题。

  • ? 角色扮演。一秒调教小爱,无论是成为你的完美伴侣,还是那个能听你倾诉心事的贴心闺蜜,都不在话下。

  • ? 流式响应。爱情来得太快就像龙卷风,而你的小爱音箱也是,对你的爱意秒回,爱你不会让你等太久。

  • ? 长短期记忆。小爱音箱现在能记住你们之间的每一次对话,越聊越默契,就像是你身边的老朋友。

  • ? 自定义 TTS。厌倦了小爱同学的语音?帮你解锁「豆包」同款音色,就像真人在回你的消息。

  • ?️ 智能家居 Agent。心情不好?小爱立刻懂你,自动帮你播放喜欢的音乐,调节灯光,逗你开心。TODO


? 启动项目

MiGPT 有两种启动方式: Docker 和 Node.js。

Docker

对于电脑小白或者不想自己配置代码运行环境(Node)的同学,可以使用 Docker 启动方式。

请先按照「配置参数」章节,配置好你的 .env 和 .migpt.js 文件,然后使用以下命令启动 docker:

docker run -d--env-file $(pwd)/.env \-v $(pwd)/.migpt.js:/app/.migpt.js \idootop/mi-gpt:latest


Node.js

如果你是一名前端 (Node) 开发者,也可以通过 NPM 安装 mi-gpt 启动 MiGPT。

npm install mi-gpt # 安装依赖

然后,创建并启动 MiGPT 实例。初始化参数请看下面的「配置参数」章节。

import { MiGPT } from "mi-gpt";
async function main() {const client = MiGPT.create({speaker: {userId: "944123456", // 注意:不是手机号或邮箱,请在「个人信息」-「小米 ID」查看password: "123456", // 账号密码did: "小爱音箱Pro", // 小爱音箱 ID 或在米家中设置的名称},});await client.start();}
main();


配置参数

.migpt.js

重命名本项目根目录下的 .migpt.example.js 文件为 .migpt.js。

然后,将里面的配置参数修改成你自己的,参数含义如下:

参数名称描述示例
bot

name对方名称(小爱音箱)"傻妞"
profile对方的个人简介/人设"性别女,性格乖巧可爱,喜欢搞怪,爱吃醋。"
master

name主人名称(我自己)"陆小千"
profile主人的个人简介/人设"性别男,善良正直,总是舍己为人,是傻妞的主人。"
room

name会话群名称"魔幻手机"
description会话群简介"傻妞和陆小千的私聊"
speaker

userId小米 ID(注意:不是手机号或邮箱)"944123456"
password账户密码"123456"
did小爱音箱 ID 或名称"小爱音箱 Pro"
ttsCommand小爱音箱 TTS 指令(可在此查询)[5, 1]
wakeUpCommand小爱音箱唤醒指令(可在此查询)[5, 3]
playingCommand小爱音箱是否在播放中指令(可在此查询)[3, 1, 1]
speaker 其他参数(可选)

callAIKeywords当消息以关键词开头时,会调用 AI 来响应用户消息["请", "傻妞"]
wakeUpKeywords当消息以关键词开头时,会进入 AI 唤醒状态["召唤傻妞", "打开傻妞"]
exitKeywords当消息以关键词开头时,会退出 AI 唤醒状态["退出傻妞", "关闭傻妞"]
onEnterAI进入 AI 模式的欢迎语["你好,我是傻妞,很高兴认识你"]
onExitAI退出 AI 模式的提示语["傻妞已退出"]
onAIAskingAI 开始回答时的提示语["让我先想想", "请稍等"]
onAIRepliedAI 结束回答时的提示语["我说完了", "还有其他问题吗"]
onAIErrorAI 回答异常时的提示语["出错了,请稍后再试吧!"]
exitKeepAliveAfter无响应一段时间后,多久自动退出唤醒模式(单位秒,默认 30 秒)30


环境变量

重命名本项目根目录下的 .env.example 文件为 .env。

然后,将里面的环境变量修改成你自己的,参数含义如下:

环境变量名称描述示例
OpenAI

OPENAI_API_KEYOpenAI API 密钥abc123
OPENAI_MODEL使用的 OpenAI 模型gpt-4o
AZURE_OPENAI_API_KEY可选,Microsoft Azure OpenAIabc123
OPENAI_BASE_URL可选,OpenAI API BaseURLhttps://api.openai.com/v1
提示音效(可选)

AUDIO_SILENT静音音频链接"https://example.com/slient.wav"
AUDIO_BEEP默认提示音链接"https://example.com/beep.wav"
AUDIO_ACTIVE唤醒提示音链接"https://example.com/active.wav"
AUDIO_ERROR出错提示音链接"https://example.com/error.wav"
豆包 TTS(可选)

TTS_DOUBAO豆包 TTS 接口"https://example.com/tts.wav"
SPEAKERS_DOUBAO豆包 TTS 音色列表接口"https://example.com/tts-speakers"


? 常见问题

Q:支持哪些型号的小爱音箱?

大部分型号的小爱音箱都支持,推荐小爱音箱 Pro(完美运行)。部分机型的 MioT 接口开放能力并不完整,比如小米音箱 Play 增强版(L05C),将会导致 MiGPT 部分功能异常,相关 issue。

Q:除了 OpenAI 还支持哪些模型,如何设置?

理论上兼容 OpenAI SDK 的模型都支持,只需修改环境变量即可接入到 MiGPT。

比如:通义千问、零一万物、Moonshot、DeepSeek 等,以 Moonshot 为例:

OPENAI_BASE_URL=https://api.moonshot.cn/v1OPENAI_MODEL=moonshot-v1-8kOPENAI_API_KEY=$MOONSHOT_API_KEY

Q:登录小米账号失败,提示 401

  1. 账号密码不正确:小米 ID 并非手机号或邮箱,请在「个人信息」-「小米 ID」查看。

  2. 网络异常:如果你的账号密码确认配置正确,出现 401 登录异常大概率是因为网络异常,或当前 IP 小米账号登录被风控。请尝试切换代理或等待一段时间(2-24 小时)后再试。issue#10

Q:小爱音箱收到消息后,没有调用 AI 进行回复

MiGPT 收到消息默认不会调用 AI 进行回复,只会回复以唤醒词(callAIKeywords)开头的消息,比如:“请问 xxx”、“你 xxx” 等,你也可以自定义唤醒词列表。

Q:小爱音箱没有播放 AI 的回答,但控制台有打印 AI 的回复

不同型号的小爱音箱 TTS 指令不同: https://github.com/idootop/mi-gpt/issues/5

请到 https://home.miot-spec.com 查询具体指令,并修改配置文件中的 ttsCommand 参数。


项目链接

https://github.com/idootop/mi-gpt

 



53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询