微信扫码
与创始人交个朋友
我要投稿
腾讯悄咪咪开源了两款新模型:
Hunyuan3D-1.0 和 Hunyuan-Large
开源大模型更新到这个版本,早就从光刷榜变成了卷应用创新。简单来说,模型已经从只追求分数变成了探索能力实现的边界。
故事要从我是如何发现这两个模型开始:
到年底了,我开始计划打卡我的第一百座城市,
跟以往不同的是,我想挑战一下 AI 化这次的旅行。
旅行时,导航语音用自己配的,车载音乐用Suno实时生成,旅行结束修图时,还可以用AI生图把过去和现在融到同一个画面中。
当我到了下载离线地图的一步,发现腾讯地图悄咪咪上了一个自定义3D车标功能。(小声bb,隔壁家的3D车标还是付费功能)。
玩起来根本停不下来,
这个功能也太适合整活了,虽然已经反复跟我强调了要上传一个完整物体,但我还是传了一张我家狗的近照。
哈哈哈哈哈,虽然它没法陪我去,但是我可以做成狗狗车载着我去~
强烈建议腾讯做一个网站,专门拿来展示社区用户做出来的车标们,我想都收藏起来,或者将自己的手办墙都转成3D资产。
今天腾讯还把这个 3D 模型开源了,它就是:
Hunyuan3D-1.0
在两个公开的 3D 数据集 GSO 与 OmniObject3D 上,Hunyuan3D-1.0效果优于主流开源模型。
而这个 3D 生成功能也在腾讯元宝上线了,拍张正脸照就可以做个 3D 小人,还能自由切换不同的姿势。
仔细想想之后线下买手办是不是都可以实时3D化了。
(看?,马斯克小人)
同期开源的还不止 3D 大模型,常规的文本生成模型也开源了更大规模的。
Hunyuan-Large
总参数量389B,激活参数量50B,上下文长度达128k,是当前业界参数规模最大、效果最好的开源 MoE 模型。多个榜单上全面超过 DeepSeek-v2,LIama3.1-405B,Mixtral-8x22B 等开源模型。
最爽的是支持用 openai 同款格式调用了,夸张点说市面能自定义模型 API 的软件都能用上 Hunyuan-Large。
光说参数,可能体现不出来它的实用之处。有一个功能,我就眼馋很久了:
一般搜索时,我们需要浏览10-30个页面才能把这一件事了解个大概,在质量远比不上一篇整理好的公众号文章。在腾讯元宝里,微信公众号可以直接作为 AI 搜索的信息源之一,单篇文章基本都能自成体系,效率加倍。
除了搜索,我还可以直接把公众号链接丢进元宝,就可以读取所有的内容,根本不用担心图片格式啥的。
除了这个,还有一个使用技巧,我称之为,
定向搜索
我们可以将平时常看的公众号做成列表,在使用元宝的时候将这些作为关键词,直接总结出这些主流账号对某件事的讲解、对于某些事件的看法、甚至是他们自己公众号的写作风格:
这有个硬伤,就是公众号的文章内容是外面的大模型读取不了的,但元宝都可以,而且非常好用。
就是那么巧,我昨天发现了 chatbox 能跟 hunyuan api 形成热血沸腾的组合技,
简单来说,我们可以通过 Hunyuan-Large API,在任意平台做一个原生元宝了,用来处理博客和 AI 写作都是一流!
目前,混元Large模型已上架腾讯云TI-ONE训练平台,支持在线精调专属模型。
官方的手把手级别教程让我计划后续做一个旅行博主版的数字分身,毕竟Vlogger这个新鲜的蛋糕我也想跨界尝一口。
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-12-22
花60元,DIY了一个AI机器人,能聊天,会认人……
2024-12-21
基于AI智能助理的软件开源组件安全检查
2024-12-21
Llama2024年度要点总结
2024-12-21
重磅! Github Copilot 免费了
2024-12-20
万字长文帮你搞定AI Agent选型
2024-12-20
微软开源的 Markitdown 可将任意文件转换为 Markdown 格式,PDF 解析咋样?
2024-12-20
Claude的MCP(模型上下文协议)简介
2024-12-20
历时2年,华人团队力作,震撼开源生成式物理引擎Genesis,可模拟世界万物
2024-05-06
2024-07-25
2024-08-13
2024-06-12
2024-07-11
2024-06-16
2024-07-20
2024-09-20
2024-06-15
2024-07-25
2024-12-20
2024-12-19
2024-11-22
2024-11-19
2024-11-13
2024-11-13
2024-10-07
2024-09-22