微信扫码
与创始人交个朋友
分享嘉宾|宁鲲鹏 元空AI技术联合创始人
内容已做精简,如需获取专家完整版视频实录和课件,请扫码领取。
Web Agent自动化解决方案
02
北大Open Sora生成能力增强
目前非常火的项目视频生成( open Sora )。Open AI很早发布了Sora,虽然没有对外开放,但效果非常炸裂惊艳。我们团队希望用开源的力量复现出Sora,成为视觉版LLaMA。因为算力有限,希望以开源的方式让更多的算力进来,让Sora能力越来越强,这是团队的初衷。
比较标准的方案具体有三部分,第一部分是视频的压缩和解压,形象点来说在电脑上把所有视频压缩成zip 包,然后再进行解压。中间部分可以理解成 zip 包,只不过由编码方式来进编码,VAE是经典的模型,把原始视频输进去,能达到一分钟 720P 的重建Demo,压缩率目前可达到 256 倍,个人也认为,只要把信息压缩得足够多,生成效果会越好。这并不是用文本生成视频,这是重构,意味着把原视频输进去,通过压缩再解压,是否能还原。
以上就是本次分享,如需获取专家完整版视频实录和课件可扫码领取。
⩓
北京大学计算机学院博士。ChatExcel 发起人,登上知乎、36Kr等多个媒体热搜,曝光量达5000w+,使用人数500w+,日活最高突破15w+曾就职于京东搜索广告产品研发,在腾讯AI Lab&ARC lab、华为拍照工程部进行学术上的基础研究。在CRPR、AAAI、IJCAI、KDD等国际顶级会议上发表论文4篇。
注:点击左下角“阅读原文”,领取专家完整版实录和分享课件。
53AI,大模型落地应用首选服务商
定位:开箱即用的大模型落地应用平台
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
如果你看见AI对商业世界的变革,欢迎来和我们一起探索~
2024-06-29
一文讲透AI Prompt提示词工程 (上)
2024-06-29
RAG流程优化(微调)的4个基本策略
2024-06-29
详细教程!探索DALL·E的强大功能!
2024-06-29
大模型技术及趋势总结
2024-06-29
太棒啦!MARS5-TTS:仅需几秒音频参考,即可克隆您的声音,连情感都一模一样!
2024-06-29
ChatGPT Mac 版应用向所有用户免费开放,如何下载使用?
2024-06-29
一个AI驱动的搜索引擎,内置SearXNG,也许是未来搜索新姿态,Star 10K!
2024-06-29
如何花3400配置一台室内无噪音,48GB显存的深度学习服务器?
2024-04-24
2024-05-14
2024-04-24
2024-04-23
2024-04-11
2024-04-26
2024-03-22
2024-03-29
2024-04-25
2024-04-12
2024-06-29
2024-06-29
2024-06-29
2024-06-29
2024-06-29
2024-06-28
2024-06-28
2024-06-28