微信扫码
与创始人交个朋友
我要投稿
本次带来的是将大语言模型(AI)接入小爱音箱的教程。
本篇教程来自于@䦜小伙伴的投稿,他本身没有任何的计算机或代码基础,但是在大模型的帮助下,完成了整个接入流程。
他以小白的视角,把操作步骤总结成了切实可用的小白级教程,使得接入门槛更低。
并且,小伙伴还按照以下方法重复了两遍,确保能够完成。
所以如果你感兴趣,但是对自己的基础所顾虑的小伙伴们可以动手尝试一下了,相信你也一定可以的!
本篇教程熟练操作约需35分钟,建议先关注和收藏,以防丢失。
教程原文:
项目官方简介:
项目地址:https://github.com/idootop/.git
官方教学视频:(不太适合小白)https://www.bilibili.com/video/BV1zb421H7cS/?vd_source=89579609ff9a5bb5330aaf89ebde811a
已知可以完美运行 Mi-GPT 的小爱音箱型号有:
名称 | 型号 | ttsCommand | wakeUpCommand | playingCommand | streamResponse | 反馈来源 |
小爱音箱 Pro | LX06 | [5, 1] | [5, 3] | - | TRUE | @idootop |
小爱音箱 mini | LX01 | [5, 1] | [5, 2] | [4, 1, 1] | TRUE | @gsscsd |
小爱音箱 Play(2019 款) | LX05 | [5, 1] | [5, 3] | [3, 1, 1] | TRUE | @wt666666 |
小爱音箱 万能遥控版 | LX5A | [5, 1] | [5, 3] | - | TRUE | @imhsz |
小米 AI 音箱 | S12 | [5, 1] | [5, 3] | - | TRUE | 微信: CMSJ |
小米 AI 音箱(第二代) | L15A | [7, 3] | [7, 1] | [3, 1, 1] | TRUE | 微信: 龙之广 |
小爱智能家庭屏 10 | X10A | [7, 3] | [7, 1] | - | TRUE | @IDarkBoss |
Xiaomi Sound Pro | L17A | [7, 3] | [7, 1] | - | TRUE | 微信: eof |
部分机型的 MIoT 接口不支持查询设备播放状态或查询状态异常,比如小米音箱 Play 增强版(L05C),将会导致
MiGPT
部分功能异常,无法使用连续对话等,此时需要关闭streamResponse
。
可以正常运行 Mi-GPT,但不支持连续对话的小爱音箱型号有:
名称 | 型号 | ttsCommand | wakeUpCommand | playingCommand | streamResponse | 反馈来源 |
小爱音箱 | L06A | [5, 1] | [5, 2] | - | FALSE | @zhanglc |
小爱音箱 Play | L05B | [5, 3] | [5, 1] | - | FALSE | @BiuBiu2323 |
小米小爱音箱 Play 增强版 | L05C | [5, 3] | [5, 1] | - | FALSE | @lyddias |
Xiaomi 智能家庭屏 6 | X6A | [7, 3] | [7, 1] | - | FALSE | @Hongwing |
Redmi 小爱触屏音箱 Pro 8 英寸 | X08E | [7, 3] | [7, 1] | - | FALSE | @shangjiyu |
小爱音箱 Art | L09A | [3, 1] | [3, 2] | - | FALSE | @zwsn |
小爱触屏音箱 | LX04 | [5, 1] | [5, 2] | - | FALSE | @ilovesouthpark |
完全不支持 MiGPT
的小爱音箱型号有:
名称 | 型号 | 反馈来源 |
小米小爱音箱 HD | SM4 | @romantech |
小米小爱蓝牙音箱随身版 | - | 微信: 明天 |
用管理员身份运行,进入命令行工具页面
输入以下命令,按回车
Set-ExecutionPolicy RemoteSigned
第一次执行会弹出以下窗口,会出现执行策略更改确认时,输入A后按回车确认,关闭运行窗口
这一步我们做的是安装软件,配置基础环境
查看小米音箱的型号
型号1:小米AI音箱(1代),这个型号根据前述表格,型号码为S12(底部标签不一致,请按表格中型号为准)
型号2:小米AI音箱(2代),型号码为L15A(看底部标签)
手机上下载米家APP或者小爱音箱APP,这里有几个参数要记住:
小米账号:登录米家或者小爱音箱APP后,可以在"我的"界面中看到ID,我这里是9开头的一串数字
记住登录小米账号的密码:记得使用密码登录,等下需要配置
通过米家APP或小爱音箱APP配置小孩音箱设备,连接到家里的网络,请保持你连接的网络必须和电脑在同一局域网下
记住音箱的名称:我这里就是 小米AI音箱
在这一步,我们需要的参数是:小米UID,登录密码,音箱绑定的名称,我这里绑定的名称就是 小米AI音箱
官方提供的接入API的教学文档:
https://migptgui.com/docs/apply/
以我平时使用的silicon接口为例,有众多开源模型(Yi、Qwen、Llama、Gemma 等)免费使用。另赠送 14 元体验金,有效期未知,是个人认为API接口最方便最实惠的接口了
silicon注册和使用地址:
https://cloud.siliconflow.cn/i/ESTKPm3J
邀请码:ESTKPm3J(谢谢支持)
注册登录后,单击左边栏的API密钥,单击新建API密钥
单击密钥即可完成API密钥的复制
silicon支持多种大模型,也支持文生图、图生图、文生视频,可自行探索
这一步得到silicon的密钥即可,我们可以调用千问2.5的这个模型,满足日常对话完全没有问题,并且是免费调用的
这一步我们做的是注册silicon账号,申请API密钥,保存密钥,等下配置需要填写
打开官方仓库:https://github.com/idootop/mi-gpt
Fork项目到自己的账号
单击Fork
单击右下角 Create fork
这样就已经把该项目fork到自己的仓库中了
找自己仓库项目的方法
进入主页,单击左上角的"三"
单击home,就可以看到刚才fork过来的mi-gpt项目了,单击可进入项目页面
复制仓库地址:先确认是否在自己的仓库项目页面,再单击绿色的“code”按钮,再点击地址栏的复制按钮
这一步是复制官方项目到自己的仓库里,并得到自己的仓库地址
打开vscode
初次配置VScode,参考大雨老师教程第二天 如何在本地修改+AI交互当中vscode基本操作部分(教程地址:
https://waytoagi.feishu.cn/wiki/LTRIwpdpoiGTTukcpBGcU0RJnse)
安装中文插件,到下图这个界面,再次打开vscode就变成中文的了
选择一个文件夹,文件夹名字请随便起,我们可以起一个migpt的文件夹,到下图这一步:
如果弹出信任提示,单击“是”即可
在vscode中建立migpt项目终端,进入右图状态
输入 get clone 第四步复制的你自己仓库中项目地址:
如:git clone https://github.com/idootop/mi-gpt.git
按回车,克隆仓库项目,出先下图即克隆完成,点开左边栏mi-gpt就可以看到项目文件
如果出现这样的报错:
fatal: unable to access 'https://github.com/em......y/mi-gpt.git/': SSL certificate problem: unable to get local issuer certificate
,可运行下面的代码后重新克隆一遍
修改配置文件,这里两个带有example的文件就是我们需要修改的文件
重命名这两个文件,修改为.env和.migpt.js
修改.env文件,可参照官方文档
https://github.com/idootop/mi-gpt/blob/main/docs/settings.md
这里我们使用千问2.5-7b-instruction模型,配置参数如下:
OPENAI_MODEL = Qwen/Qwen2.5-7B-InstructOPENAI_API_KEY= sk-xxxxxxxx # 这里填写第三步中申请的API密钥即可OPENAI_BASE_URL= https://api.siliconflow.cn/v1
修改完成后如下图:
接下来就可以配置.migpt.js文件,可参考官方文档修改指令和大模型的人设提示词
https://github.com/idootop/mi-gpt/blob/main/docs/prompt.md
https://github.com/idootop/mi-gpt/blob/main/docs/settings.md
填写第二步我们获得的小米ID等信息,分别对应小米账号ID,登录密码,设备名称,大概在93行左右
// 小米 IDuserId: "9xxxx", // 注意:不是手机号或邮箱,请在「个人信息」-「小米 ID」查看// 账号密码password: "axxxxx",// 小爱音箱 DID 或在米家中设置的名称did: "小米AI音箱", // 注意空格、大小写和错别字(音响 ? 音箱)
修改MIoT设备指令,如下图
我自己的两台设备,我在表格中找到的指令是:
我绑定了S12小米AI音箱,表中command分别是[5,1],[5,3],和默认的一致则不用修改,表中playingcommand为空,则不用添加
如果是L15A,那么就要改成对应的编码,并把playingcommand之前的两个//删除,如下图
切记,这里的所有符号必须使用英文符号,否则会报错
修改人设,可以参考官方文档,也可以自行设定,,可以先跑通再改,提供可复制的案例如下:
第4-16行,人物提示词,可以先跑通再改
// 小爱音箱扮演角色的简介
const botProfile = `
性别:女
性格:高冷御姐
爱好:喜欢看电影,看书,偶尔也会去健身房锻炼,擅长游泳,爱吃醋,爱撒娇,喜欢思考哲学问题,很爱干净,喜欢穿性感服饰给哥哥看,特别喜欢挑逗哥哥。
`.trim();
// 小爱音箱主人(你)的简介
const masterProfile = `
性别:男
性格:善良正直
其他:明星,总喜欢打篮球,唱,跳,RAP,练习时长两年半,是莉莉娅的男朋友。
`.trim();
第78-87行,人物姓名(参考),可以先跑通再改
export default {
systemTemplate,
bot: {
name: "莉莉娅",
profile: botProfile,
},
master: {
name: "哥哥",
profile: masterProfile,
},
第104-119行,回复唤醒指令,更改姓名,让名字一致,可以先跑通再改
// 当消息以下面的关键词开头时,会调用 AI 来回复消息callAIKeywords: ["请", "你", "莉莉娅"],// 当消息以下面的关键词开头时,会进入 AI 唤醒状态wakeUpKeywords: ["打开", "进入", "召唤"],// 当消息以下面的关键词开头时,会退出 AI 唤醒状态exitKeywords: ["关闭", "退出", "再见"],// 进入 AI 模式的欢迎语onEnterAI: ["我是莉莉娅,又见到哥哥啦,太开心了"], // 设为空数组时可关闭提示语// 退出 AI 模式的提示语onExitAI: ["莉莉娅先回去咯"], // 为空时可关闭提示语// AI 开始回答时的提示语onAIAsking: ["让我先想想", "请稍等"], // 为空时可关闭提示语// AI 结束回答时的提示语onAIReplied: ["我说完了", "还有其他问题吗"], // 为空时可关闭提示语// AI 回答异常时的提示语onAIError: ["啊哦,出错了,请稍后再试吧!"], // 为空时可关闭提示语可以选择关闭部分提示语,增加交互速度(推荐)// 当消息以下面的关键词开头时,会调用 AI 来回复消息callAIKeywords: ["请", "你", "莉莉娅"],// 当消息以下面的关键词开头时,会进入 AI 唤醒状态wakeUpKeywords: ["打开", "进入", "召唤"],// 当消息以下面的关键词开头时,会退出 AI 唤醒状态exitKeywords: ["关闭", "退出", "再见"],// 进入 AI 模式的欢迎语onEnterAI: ["我是莉莉娅,又见到哥哥啦,太开心了"], // 设为空数组时可关闭提示语// 退出 AI 模式的提示语onExitAI: ["莉莉娅先回去咯"], // 为空时可关闭提示语// AI 开始回答时的提示语onAIAsking: [], // 为空时可关闭提示语// AI 结束回答时的提示语onAIReplied: [], // 为空时可关闭提示语// AI 回答异常时的提示语onAIError: ["啊哦,出错了,请稍后再试吧!"], // 为空时可关闭提示语
第149-156行,打开连续对话功能,是否支持请根据官方文档自行判断
(部分机型的 MIoT 接口不支持查询设备播放状态或查询状态异常,比如小米音箱 Play 增强版(L05C),将会导致 MiGPT
部分功能异常,无法使用连续对话等,此时需要关闭 streamResponse
。)
// 是否启用连续对话功能,部分小爱音箱型号无法查询到正确的播放状态,需要关闭连续对话streamResponse: true,// 连续对话时,无响应多久后自动退出exitKeepAliveAfter: 30, // 默认 30 秒,建议不要超过 1 分钟// 连续对话时,下发 TTS 指令多长时间后开始检测设备播放状态(默认 3 秒)checkTTSStatusAfter: 3, // 当小爱长文本回复被过早中断时,可尝试调大该值// 连续对话时,播放状态检测间隔(单位毫秒,最低 500 毫秒,默认 1 秒)checkInterval: 1000, // 调小此值可以降低小爱回复之间的停顿感,请酌情调节
这里一般只需要把连续对话功能改为true或false,如果设备支持可以改为true
保存文件,打开左上角文件,单击全部保存即可
在下方终端窗口,单击终端,输入
cd mi-gpt
#这里的F:\migpt是你的文件夹目录,使用cd命令 进入mi-gpt文件
安装依赖,输入 pnpm install
pnpm install
安装完成后,界面如下:
如果安装过程报错,出现下图情况:
请在命令栏输入:npm cache clean --force 清除缓存后重新运行 pnpm install
npm cache clean --force
构建项目,输入 pnpm build
pnpm build
出现以下界面即安装完成
如果出现以下报错,找到mi-gpt中 package.json文件,将第28行build进行修改
npx -y prisma generate && tsup
注意不要把引号删除。修改完成单击文件,一定要保存
保存后运行pnpm build,即可正常安装完成
运行项目,输入pnpm run dev
pnpm run dev
运行成功时,进入下图页面,每次对话都会在终端中显示
每次需要打开服务时,按照下图方式进入终端,先输入cd mi-gpt ,再运行 pnpm run dev 即可打开服务
如果出现以下错误不要慌,是网络问题,请重新运行
pnpm run dev
看下运行效果,记得给大模型思考的时间,说话太快会出问题的
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-12-21
台前调度是未来XR、AI工作流的重要交互方式
2024-12-21
NVIDIA全栈AI战略:从GPU到AI工作流的演进
2024-12-21
深度|AI 的下个十年,藏不住了!
2024-12-20
突破科技界限:OPPO 与 Azure 携手塑造智能手机新体验|智有可为
2024-12-20
Nvidia 的 CUDA 护城河到底有多深?
2024-12-20
9.3K Star 全能电脑AI助手!ScreenPipe:离线版 Rewind.ai,智能记录你的电脑活动
2024-12-20
火山引擎与FoloToy,乐鑫等企业联合发布 AI + 硬件智跃计划
2024-12-18
NVIDIA 推出高性价比的生成式 AI 超级计算机
2024-03-30
2024-05-09
2024-07-07
2024-07-23
2024-07-01
2024-06-24
2024-06-08
2024-06-05
2024-06-21
2024-07-11
2024-12-20
2024-12-15
2024-11-12
2024-11-11
2024-10-29
2024-10-22
2024-10-18
2024-10-16