AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


让AI小伙伴开发了一款AI魔法学院产品
发布日期:2025-01-21 20:45:41 浏览次数: 1635 来源:前端程序设计
推荐语

这是关于开发 AI 魔法学院产品的独特经历,没有之一。

核心内容:
1. 开发此产品的背景与需求
2. 产品的开发过程与工具使用
3. 实现的炫酷效果与交互方式

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家

 

上次文章提到年前要开发一款3D数字人在教育上的学习伙伴。然后雇佣了几个AI小伙伴来为自己服务。目前基本框架搭建完成。这也是自己开始打造自己数字人应用产品的第一步。单纯做数字人聊天已经满足不了目前的客户需求了。

开发背景

自从研究AI+数字人+智能体后,一直想着给自己的娃开发一款适合它的学习伙伴。目前他正是对各种知识求知欲望最强的时候。英语+古诗+动画片+历史+音乐+数学+成语+汉字+拼音+魔方+鲁班锁等等技能每天都在疯狂增长。所以需要尽快给它做出一款适合他的学习工具。

开发过程

1. 用v0.dev开发网页的基本框架。把竞品的效果图输入,然后让它一步步还原。

借着这次机会,让AI把我之前乱成一坨的数字人代码都清晰化了,这个小伙伴值得点赞。

我整体采用的是react+threejs框架。UI上用了tailwindcss+shadn,这样就省去了做UI的工作。从上面效果图可以看出,v0.dev生成的代码结构无论是命名上还是代码规范上都非常棒。

2. 用字节最新出来的Trae这个工具梳理整个项目,微调其中的问题。

这个工具基本是cursor的升级版,对中文支持的很好。现在可以免费使用claude-3.5-sonnet,不用白不用,赶紧帮我干事才是正题。

炫酷的开场动画

为了让网站看起来更加炫酷,正好看到国外一个网站做的一个三维场景动态效果不错,于是下载里面的glb模型后,用cursor复刻了里面的着色器和动画效果。

用字节的即梦帮我生成界面的图

购买了几款数字人二次加工

最近花了点银子从3D模型网站上购买了几款代表性的人物模型,完善自己的模型库。然后重新贴图,并花了2天时间做了4个数字人的面部形态键,骨骼绑定和动画。效率简直飞速。通过这次机会,把我之前做过的所有数字人都整合进来了。

完成了三种交互方式

在数字人交互界面支持文本、话筒、电话三种输入方式的来回切换。这也是目前最常见的三种交互,全部整合进来,想用哪个用哪个。

接下来的工作

离过年还有几天时间。继续打磨整个产品。

接入各种智能体

目前已经准备好4个不同智能体,基本满足多模态的形式。明天全部接入

丰富人物的场景

将人物放置到3D场景中,更有画面感。

接入会员制的后台

分离线版和在线版两种,离线版比较费设备,根据情况收费。
在线版主要用来负担各种API。

对接好玩的应用。

比如今天看到开源的DeepSeek R1-Zero生成的Manim数学动画视频,不到30秒钟无误的生成了勾股定理解释动画,9分钟一次性完成了量子电动力学概念的视觉化。这个很有必要接入。

比如牛顿掉下苹果的案例

继续扩张各个领域的人物和知识

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询