微信扫码
与创始人交个朋友
我要投稿
这是关于开发 AI 魔法学院产品的独特经历,没有之一。 核心内容: 1. 开发此产品的背景与需求 2. 产品的开发过程与工具使用 3. 实现的炫酷效果与交互方式
上次文章提到年前要开发一款3D数字人在教育上的学习伙伴。然后雇佣了几个AI小伙伴来为自己服务。目前基本框架搭建完成。这也是自己开始打造自己数字人应用产品的第一步。单纯做数字人聊天已经满足不了目前的客户需求了。
自从研究AI+数字人+智能体后,一直想着给自己的娃开发一款适合它的学习伙伴。目前他正是对各种知识求知欲望最强的时候。英语+古诗+动画片+历史+音乐+数学+成语+汉字+拼音+魔方+鲁班锁等等技能每天都在疯狂增长。所以需要尽快给它做出一款适合他的学习工具。
借着这次机会,让AI把我之前乱成一坨的数字人代码都清晰化了,这个小伙伴值得点赞。
我整体采用的是react+threejs框架。UI上用了tailwindcss+shadn,这样就省去了做UI的工作。从上面效果图可以看出,v0.dev生成的代码结构无论是命名上还是代码规范上都非常棒。
这个工具基本是cursor的升级版,对中文支持的很好。现在可以免费使用claude-3.5-sonnet,不用白不用,赶紧帮我干事才是正题。
为了让网站看起来更加炫酷,正好看到国外一个网站做的一个三维场景动态效果不错,于是下载里面的glb模型后,用cursor复刻了里面的着色器和动画效果。
最近花了点银子从3D模型网站上购买了几款代表性的人物模型,完善自己的模型库。然后重新贴图,并花了2天时间做了4个数字人的面部形态键,骨骼绑定和动画。效率简直飞速。通过这次机会,把我之前做过的所有数字人都整合进来了。
在数字人交互界面支持文本、话筒、电话三种输入方式的来回切换。这也是目前最常见的三种交互,全部整合进来,想用哪个用哪个。
离过年还有几天时间。继续打磨整个产品。
目前已经准备好4个不同智能体,基本满足多模态的形式。明天全部接入
将人物放置到3D场景中,更有画面感。
分离线版和在线版两种,离线版比较费设备,根据情况收费。
在线版主要用来负担各种API。
比如今天看到开源的DeepSeek R1-Zero生成的Manim数学动画视频,不到30秒钟无误的生成了勾股定理解释动画,9分钟一次性完成了量子电动力学概念的视觉化。这个很有必要接入。
比如牛顿掉下苹果的案例
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-09-04
2024-09-26
2024-10-30
2024-12-25
2024-10-30
2024-09-03
2024-09-06
2024-08-18
2024-11-23
2024-09-02