AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


手把手教你免费把AI大模型接入小米音箱,无需任何代码基础,小白级基础详细操作教程!
发布日期:2024-10-20 15:03:31 浏览次数: 4647 来源:WayToAGI Agent探索
Equity AI



本次带来的是将大语言模型(AI)接入小爱音箱的教程。


本篇教程来自于@䦜小伙伴的投稿,他本身没有任何的计算机或代码基础,但是在大模型的帮助下,完成了整个接入流程。

他以小白的视角,把操作步骤总结成了切实可用的小白级教程,使得接入门槛更低。

并且,小伙伴还按照以下方法重复了两遍,确保能够完成。

所以如果你感兴趣,但是对自己的基础所顾虑的小伙伴们可以动手尝试一下了,相信你也一定可以的!


本篇教程熟练操作约需35分钟,建议先关注和收藏,以防丢失。


教程原文:


项目官方简介:

项目地址:https://github.com/idootop/.git

官方教学视频:(不太适合小白)https://www.bilibili.com/video/BV1zb421H7cS/?vd_source=89579609ff9a5bb5330aaf89ebde811a

视频配套 PPT 文件
蓝奏云:https://wwt.lanzout.com/iLHm2238xf5c
阿里云盘:https://www.alipan.com/s/Yf2RQvN961T

支持的小米音箱设备型号

完美运行

已知可以完美运行 Mi-GPT 的小爱音箱型号有:

名称型号ttsCommandwakeUpCommandplayingCommandstreamResponse反馈来源
小爱音箱 ProLX06[5, 1][5, 3]-TRUE@idootop
小爱音箱 miniLX01[5, 1][5, 2][4, 1, 1]TRUE@gsscsd
小爱音箱 Play(2019 款)LX05[5, 1][5, 3][3, 1, 1]TRUE@wt666666
小爱音箱 万能遥控版LX5A[5, 1][5, 3]-TRUE@imhsz
小米 AI 音箱S12[5, 1][5, 3]-TRUE微信: CMSJ
小米 AI 音箱(第二代)L15A[7, 3][7, 1][3, 1, 1]TRUE微信: 龙之广
小爱智能家庭屏 10X10A[7, 3][7, 1]-TRUE@IDarkBoss
Xiaomi Sound ProL17A[7, 3][7, 1]-TRUE微信: eof


? 正常运行

部分机型的 MIoT 接口不支持查询设备播放状态或查询状态异常,比如小米音箱 Play 增强版(L05C),将会导致 MiGPT 部分功能异常,无法使用连续对话等,此时需要关闭 streamResponse

可以正常运行 Mi-GPT,但不支持连续对话的小爱音箱型号有:


名称型号ttsCommandwakeUpCommandplayingCommandstreamResponse反馈来源
小爱音箱L06A[5, 1][5, 2]-FALSE@zhanglc
小爱音箱 PlayL05B[5, 3][5, 1]-FALSE@BiuBiu2323
小米小爱音箱 Play 增强版L05C[5, 3][5, 1]-FALSE@lyddias
Xiaomi 智能家庭屏 6X6A[7, 3][7, 1]-FALSE@Hongwing
Redmi 小爱触屏音箱 Pro 8 英寸X08E[7, 3][7, 1]-FALSE@shangjiyu
小爱音箱 ArtL09A[3, 1][3, 2]-FALSE@zwsn
小爱触屏音箱LX04[5, 1][5, 2]-FALSE@ilovesouthpark


❌ 不支持

完全不支持 MiGPT 的小爱音箱型号有:

名称型号反馈来源
小米小爱音箱 HDSM4@romantech
小米小爱蓝牙音箱随身版-微信: 明天


案例设备:我用的是小米AI音箱 1代,S12

  • 先只看型号,找到自己小米音箱的型号是否在上面的列表当中

本地部署教学(Node.js)

  • 这个方案需要电脑一直开着migpt的服务才行,关了电脑大模型就不生效了,你可以把小爱同学当作你的电脑音箱,还是那种可以随时解答问题的音箱,其实也挺有意思的


准备完毕,部署开始:

第一步:电脑需要安装的软件和环境配置:

  • Python 3.8以上的版本 ( https://www.python.org/)
  • Vscode ( https://code.visualstudio.com/)
  • nodeJS (https://nodejs.org/zh-cn)
  • Github 需要有账号 (https://github.com/)
  • Github 经常会打不开,可以下载一个steam++,https://steampp.net/
  • 安装方法参考大雨老师的教学:本地电脑请安装VSCode,NodeJS,Git等
上述软件请自行安装完成
(地址:https://waytoagi.feishu.cn/wiki/EJuiwrcJCi8uW1kTutrcBtBlnyc)
重要!安装完成后,需要配置环境,否则后面的部署过程中运行会报错
  1. 搜索 windows powershell

  1. 用管理员身份运行,进入命令行工具页面

  1. 输入以下命令,按回车

Set-ExecutionPolicy RemoteSigned

第一次执行会弹出以下窗口,会出现执行策略更改确认时,输入A后按回车确认,关闭运行窗口

  • 这一步我们做的是安装软件,配置基础环境


第二步:准备小米音箱


  1. 查看小米音箱的型号

  2. 型号1:小米AI音箱(1代),这个型号根据前述表格,型号码为S12(底部标签不一致,请按表格中型号为准)

  1. 型号2:小米AI音箱(2代),型号码为L15A(看底部标签)

  1. 手机上下载米家APP或者小爱音箱APP,这里有几个参数要记住:

  • 小米账号:登录米家或者小爱音箱APP后,可以在"我的"界面中看到ID,我这里是9开头的一串数字

  • 记住登录小米账号的密码:记得使用密码登录,等下需要配置

  • 通过米家APP或小爱音箱APP配置小孩音箱设备,连接到家里的网络,请保持你连接的网络必须和电脑在同一局域网下

  • 记住音箱的名称:我这里就是 小米AI音箱

  • 在这一步,我们需要的参数是:小米UID,登录密码,音箱绑定的名称,我这里绑定的名称就是 小米AI音箱


第三步:申请大模型的API接口,以silicon为例


  • 官方提供的接入API的教学文档:

https://migptgui.com/docs/apply/

  • 以我平时使用的silicon接口为例,有众多开源模型(Yi、Qwen、Llama、Gemma 等)免费使用。另赠送 14 元体验金,有效期未知,是个人认为API接口最方便最实惠的接口了

  • silicon注册和使用地址:

https://cloud.siliconflow.cn/i/ESTKPm3J

邀请码:ESTKPm3J(谢谢支持)

  • 注册登录后,单击左边栏的API密钥,单击新建API密钥

单击密钥即可完成API密钥的复制

  • silicon支持多种大模型,也支持文生图、图生图、文生视频,可自行探索

  • 这一步得到silicon的密钥即可,我们可以调用千问2.5的这个模型,满足日常对话完全没有问题,并且是免费调用的

  • 这一步我们做的是注册silicon账号,申请API密钥,保存密钥,等下配置需要填写


第四步:进入github复制mi-gpt项目


  • 打开官方仓库:https://github.com/idootop/mi-gpt

  • Fork项目到自己的账号

  1. 单击Fork

  1. 单击右下角 Create fork

  1. 这样就已经把该项目fork到自己的仓库中了

  1. 找自己仓库项目的方法

进入主页,单击左上角的"三"

单击home,就可以看到刚才fork过来的mi-gpt项目了,单击可进入项目页面

  1. 复制仓库地址:先确认是否在自己的仓库项目页面,再单击绿色的“code”按钮,再点击地址栏的复制按钮

  • 这一步是复制官方项目到自己的仓库里,并得到自己的仓库地址


第五步:打开vscode,克隆项目,并找到配置文件


  1. 打开vscode

  1. 初次配置VScode,参考大雨老师教程第二天 如何在本地修改+AI交互当中vscode基本操作部分(教地址:

    https://waytoagi.feishu.cn/wiki/LTRIwpdpoiGTTukcpBGcU0RJnse)

  • 安装中文插件,到下图这个界面,再次打开vscode就变成中文的了

  • 选择一个文件夹,文件夹名字请随便起,我们可以起一个migpt的文件夹,到下图这一步:

  • 如果弹出信任提示,单击“是”即可

  1. 在vscode中建立migpt项目终端,进入右图状态

  1. 输入 get clone 第四步复制的你自己仓库中项目地址:

  2. 如:git clone https://github.com/idootop/mi-gpt.git

  1. 按回车,克隆仓库项目,出先下图即克隆完成,点开左边栏mi-gpt就可以看到项目文件

如果出现这样的报错:

fatal: unable to access 'https://github.com/em......y/mi-gpt.git/': SSL certificate problem: unable to get local issuer certificate

,可运行下面的代码后重新克隆一遍

  1. 修改配置文件,这里两个带有example的文件就是我们需要修改的文件

  1. 重命名这两个文件,修改为.env和.migpt.js

第六步:修改vscode配置文件

  1. 修改.env文件,可参照官方文档

https://github.com/idootop/mi-gpt/blob/main/docs/settings.md

  1. 这里我们使用千问2.5-7b-instruction模型,配置参数如下:

OPENAI_MODEL = Qwen/Qwen2.5-7B-InstructOPENAI_API_KEY= sk-xxxxxxxx # 这里填写第三步中申请的API密钥即可OPENAI_BASE_URL= https://api.siliconflow.cn/v1

  1. 修改完成后如下图:

接下来就可以配置.migpt.js文件,可参考官方文档修改指令和大模型的人设提示词

https://github.com/idootop/mi-gpt/blob/main/docs/prompt.md

https://github.com/idootop/mi-gpt/blob/main/docs/settings.md

  1. 填写第二步我们获得的小米ID等信息,分别对应小米账号ID,登录密码,设备名称,大概在93行左右

 
 // 小米 IDuserId: "9xxxx", // 注意:不是手机号或邮箱,请在「个人信息」-「小米 ID」查看// 账号密码password: "axxxxx",// 小爱音箱 DID 或在米家中设置的名称did: "小米AI音箱", // 注意空格、大小写和错别字(音响 ? 音箱)

  1. 修改MIoT设备指令,如下图

  • 我自己的两台设备,我在表格中找到的指令是:

  • 我绑定了S12小米AI音箱,表中command分别是[5,1],[5,3],和默认的一致则不用修改,表中playingcommand为空,则不用添加

  • 如果是L15A,那么就要改成对应的编码,并把playingcommand之前的两个//删除,如下图

  • 切记,这里的所有符号必须使用英文符号,否则会报错

  1. 修改人设,可以参考官方文档,也可以自行设定,,可以先跑通再改,提供可复制的案例如下:

第4-16行,人物提示词,可以先跑通再改


// 小爱音箱扮演角色的简介const botProfile = `性别:女性格:高冷御姐爱好:喜欢看电影,看书,偶尔也会去健身房锻炼,擅长游泳,爱吃醋,爱撒娇,喜欢思考哲学问题,很爱干净,喜欢穿性感服饰给哥哥看,特别喜欢挑逗哥哥。`.trim();
// 小爱音箱主人(你)的简介const masterProfile = `性别:男性格:善良正直其他:明星,总喜欢打篮球,唱,跳,RAP,练习时长两年半,是莉莉娅的男朋友。`.trim();78-87行,人物姓名(参考),可以先跑通再改export default {systemTemplate,bot: {name: "莉莉娅",profile: botProfile,},master: {name: "哥哥",profile: masterProfile,},

第104-119行,回复唤醒指令,更改姓名,让名字一致,可以先跑通再改


// 当消息以下面的关键词开头时,会调用 AI 来回复消息callAIKeywords: ["请", "你", "莉莉娅"],// 当消息以下面的关键词开头时,会进入 AI 唤醒状态wakeUpKeywords: ["打开", "进入", "召唤"],// 当消息以下面的关键词开头时,会退出 AI 唤醒状态exitKeywords: ["关闭", "退出", "再见"],// 进入 AI 模式的欢迎语onEnterAI: ["我是莉莉娅,又见到哥哥啦,太开心了"], // 设为空数组时可关闭提示语// 退出 AI 模式的提示语onExitAI: ["莉莉娅先回去咯"], // 为空时可关闭提示语// AI 开始回答时的提示语onAIAsking: ["让我先想想", "请稍等"], // 为空时可关闭提示语// AI 结束回答时的提示语onAIReplied: ["我说完了", "还有其他问题吗"], // 为空时可关闭提示语// AI 回答异常时的提示语onAIError: ["啊哦,出错了,请稍后再试吧!"], // 为空时可关闭提示语可以选择关闭部分提示语,增加交互速度(推荐)// 当消息以下面的关键词开头时,会调用 AI 来回复消息callAIKeywords: ["请", "你", "莉莉娅"],// 当消息以下面的关键词开头时,会进入 AI 唤醒状态wakeUpKeywords: ["打开", "进入", "召唤"],// 当消息以下面的关键词开头时,会退出 AI 唤醒状态exitKeywords: ["关闭", "退出", "再见"],// 进入 AI 模式的欢迎语onEnterAI: ["我是莉莉娅,又见到哥哥啦,太开心了"], // 设为空数组时可关闭提示语// 退出 AI 模式的提示语onExitAI: ["莉莉娅先回去咯"], // 为空时可关闭提示语// AI 开始回答时的提示语onAIAsking: [], // 为空时可关闭提示语// AI 结束回答时的提示语onAIReplied: [], // 为空时可关闭提示语// AI 回答异常时的提示语onAIError: ["啊哦,出错了,请稍后再试吧!"], // 为空时可关闭提示语

第149-156行,打开连续对话功能,是否支持请根据官方文档自行判断

(部分机型的 MIoT 接口不支持查询设备播放状态或查询状态异常,比如小米音箱 Play 增强版(L05C),将会导致 MiGPT 部分功能异常,无法使用连续对话等,此时需要关闭 streamResponse。)

// 是否启用连续对话功能,部分小爱音箱型号无法查询到正确的播放状态,需要关闭连续对话streamResponse: true,// 连续对话时,无响应多久后自动退出exitKeepAliveAfter: 30, // 默认 30 秒,建议不要超过 1 分钟// 连续对话时,下发 TTS 指令多长时间后开始检测设备播放状态(默认 3 秒)checkTTSStatusAfter: 3, // 当小爱长文本回复被过早中断时,可尝试调大该值// 连续对话时,播放状态检测间隔(单位毫秒,最低 500 毫秒,默认 1 秒)checkInterval: 1000, // 调小此值可以降低小爱回复之间的停顿感,请酌情调节

这里一般只需要把连续对话功能改为true或false,如果设备支持可以改为true

  1. 保存文件,打开左上角文件,单击全部保存即可

第七步:安装依赖并运行


  1. 在下方终端窗口,单击终端,输入

    cd mi-gpt
 #这里的F:\migpt是你的文件夹目录,使用cd命令 进入mi-gpt文件

  1. 安装依赖,输入 pnpm install

pnpm install

安装完成后,界面如下:

如果安装过程报错,出现下图情况:

请在命令栏输入:npm cache clean --force 清除缓存后重新运行 pnpm install

npm cache clean --force

  1. 构建项目,输入 pnpm build

 pnpm build

出现以下界面即安装完成

如果出现以下报错,找到mi-gpt中 package.json文件,将第28行build进行修改

npx -y prisma generate && tsup

注意不要把引号删除。修改完成单击文件,一定要保存

保存后运行pnpm build,即可正常安装完成

  1. 运行项目,输入pnpm run dev

pnpm run dev

  1. 运行成功时,进入下图页面,每次对话都会在终端中显示

  1. 每次需要打开服务时,按照下图方式进入终端,先输入cd mi-gpt ,再运行 pnpm run dev 即可打开服务

如果出现以下错误不要慌,是网络问题,请重新运行

pnpm run dev

  1. 看下运行效果,记得给大模型思考的时间,说话太快会出问题的



53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询