中国短视频行业里,抖音与快手如双子星般璀璨夺目,它们的较量不仅是流量的争夺,更是创新的碰撞。
注:本文部分图片来源网络,侵权删。
十年砥砺,从初露锋芒到如今的行业巨头,它们的故事伴随着国内移动互联网的飞速发展,也映照了技术变革的每一个瞬间。
潮起:移动互联网的黄金时代
这十年,是移动互联网的黄金时代,两大平台在短视频的浪潮中乘风破浪。
两大短视频平台不仅在内容创作上各领风骚,有不同的定位,在用户心中也各自占据了不可替代的位置。
抖音最初面向时尚年轻人,起初以"让崇拜从这里开始"为口号,后改为现在的口号,内容从音乐短视频转向多样化原创短视频,注重内容质量和创作者能力,流量分配中心化,更关注内容与人的连接,社交属性较弱。快手以"记录生活,被世界看到"为理念,强调公平普惠,重视每个用户,产品设计简单易用,不设置榜单,流量分配去中心化,长尾内容曝光机会多,更接地气,降低创作门槛,对创作者友好,更注重社交连接。
抖音界面设计注重用户体验,提供沉浸式体验,减少用户选择。应用启动即自动播放视频,降低观看门槛。
快手转型短视频后,界面保持简洁,视频以双列卡片形式展示,需用户选择后播放,沉浸感不如抖音。最初平台持中立态度,不设榜单,后因规模扩大和增长压力,加强内容运营,"搜索"页加入热榜。
两款产品之所以能成为现象级应用,除了短视频形式外,关键在于4G时代推荐算法技术远远超过了以往的产品推荐逻辑,这种算法极大地推动了内容分发模式的变革,这是两大超级应用崛起的根本原因。
从抖音内容的推荐分发流程来看,内容经过发布后先审核,然后根据用户互动(如观看、点赞、评论、转发)决定是否推向更多观众。优质内容会经过多轮筛选,获得更多曝光,而其他内容则曝光较少,导致流量集中在少数精品上。
快手内容发布流程与抖音类似,内容经审核后进入初始流量池,如"关注"和"同城"页面。快手更注重达人与粉丝互动,评论率是关键指标。优质内容会逐步进入更大的流量池,甚至首页"发现"页面。与抖音不同的是,快手使用"基尼系数调控"来平衡内容曝光,避免少数头部内容占据过多流量。快手官方数据显示,仅30%流量分配给热门内容,其余70%流量支持中长尾内容,体现其"公平普惠"的价值观。
抖音的分发机制是给优质内容和产出账号不断赋予流量,促进优秀内容创作者产出,而快手会基于“基尼系数”调控流量的分发,限制流量集中,两个平台的创作者粉丝量也呈现不同的分布。
随着技术的不断演进,它们的竞争也从单一的短视频赛道,拓展到了更广阔的天地。
你追我赶:AI领域的竞逐
字节凭借其强大的技术实力和创新能力(钞能力),在AI领域布局深远。
从自研大模型到AI教育领域,从音乐生成到代码辅助产品,字节作为一个超级APP生产工厂,它的AI产品业务已经覆盖了多个领域,展现了其庞大的野心与深远的布局,或许将成为下一个AI时代的超级“抖音”APP。
1. 基座大模型系列:字节豆包系列大模型 VS 快手快意大模型
豆包大模型,字节跳动的自研大模型,是其AI战略的核心。它不仅支撑着字节的多个应用场景,还与国际知名的ChatGPT等产品同台竞技,展现出字节在AI领域的深厚实力。
豆包大模型包含两款通用模型:
火山引擎还推出了多种专业模型,包括角色扮演模型,它可以根据上下文自适应用户需求,推动剧情发展;豆包语音系列模型,包括高准确率的语音识别、自然流畅的语音合成,以及能快速复刻声音的模型,这些模型支持多语种并具有高度个性化特征。
「快意」大模型(KwaiYii)是快手AI团队独立研发的大规模语言模型系列,包含不同参数规模的模型,如基础预训练模型(KwaiYii-Base)和对话模型(KwaiYii-Chat)。
github:https://github.com/kwai/KwaiYii
快手内测“AI小快” 可借助快意大模型在评论区实现智能回复
2. 文生图/视频模型:字节即梦AI VS 快手可图/可灵
Hugging Face社区的最新榜单显示,字节发布的SDXL-Lightning模型在趋势榜上名列前茅。SDXL-Lightning与谷歌的Gemma系列、Stability AI的Stable Cascade等模型一同上榜。字节跳动的SDXL-Lightning运用了渐进式对抗蒸馏技术,大幅提高了生成速度,能在2至4步内快速生成高质高分辨率图像,速度提升十倍,成为1024分辨率下最快的图像生成模型,同时显著降低了计算成本。MagicVideo-V2是字节跳动研发的高清文生视频模型,它在视频清晰度、流畅性、连贯性和文本语义转换等方面超越了现有的Gen-2、Stable Video Diffusion、Pika 1.0等模型。
该模型集图像生成、视频生成、视频转换和帧插值四种功能于一身,攻克了文生视频领域的多个技术难题。它由图像生成、图像转视频、视频转视频和帧插值四个子模块组成,这些模块的整合让MagicVideo-V2在人类评估中获得了好评。
MagicVideo-V2是字节跳动团队开发的AI视频生成技术,它整合了文本到图像的转换、视频动态生成、参考图像融合和帧插值技术,实现了从文本到高保真、视觉连贯视频的端到端生成。
项目主页:https://magicvideov2.github.io/
Arxiv论文:https://arxiv.org/abs/2401.04468
7月6日,快手的高级副总裁在WAIC上宣布,快手的文生图大模型可图(Kolors)将开源。这个模型支持中英文,生成效果达到Midjourney-v6水平,能处理256字符的文本,具备双语书写能力。可图(Kolors)已在Huggingface和GitHub上免费提供给开发者使用,包括模型权重和代码。
官网地址:https://kwai-kolors.github.io/Github 项目地址:https://github.com/Kwai-Kolors/KolorsHuggingface 模型地址:https://huggingface.co/Kwai-Kolors/Kolorshttps://github.com/Kwai-Kolors/Kolors/blob/master/imgs/Kolors_paper.pdf可灵大模型(Kling)是由快手大模型团队自研打造的视频生成大模型,具备强大的视频生成能力 让用户可以轻松高效地完成艺术视频创作,尚未开源。
可灵图生视频模型以卓越的图像理解能力为基础,将静态图像转化为生动的5秒精彩视频。
3. AI对话Bot:字节小悟空/豆包 VS 快手飞船
小悟空是字节推出的AI对话助手和个人助理,原名悟空搜索。与豆包AI聊天机器人使用相同内核,提供更多预设工具,支持智能对话和多种内容创作。
支持10余类数十种智能工具,包括创作、创意、写作、学习、翻译、职场、办公、营销、生活、专业咨询、儿童教育、虚拟形象、趣味测试和书籍电影推荐等,旨在满足用户在工作、学习和娱乐方面的需求。
豆包是字节推出的多功能AI工具和免费聊天机器人,模型基座是豆包大模型,具备文案创作、PDF问答、文本分析、学习辅助、图像生成、信息搜索、AI智能体等功能,能够理解用户需求,提供个性化服务。
豆包的目标是通过其先进的自然语言处理技术,提升用户在工作、学习和生活中的效率与创造力。
飞船 Kraft APP是快手推出的AI智能对话助手,提供个性化的对话体验。用户可以与官方助手”领航员”交流,或自定义AI角色进行互动。
飞船 Kraft App支持内容创作、知识解答,具备语音交互功能,提供多音色TTS选择。
4. AI克隆:抖音AI互动空间(部分KOL内测)
抖音正在测试一项新功能,允许网红通过“AI分身”与粉丝互动。用户点击主播头像,便能进入一个互动空间,体验具有主播特色的对话。
某网红拥有超过百万粉丝,参与了这项测试。他自己透露,春节后被抖音选中参与内测。经过一个月的审核,他开始训练自己的AI分身,提供语料。
整个训练过程用了大约一个月,直到5月,他的AI分身才正式推出。
5. AI虚拟陪伴:猫箱
猫箱APP是字节开发的AI社交应用,使用云雀大模型(现在叫豆包大模型)让用户与各种虚拟AI角色实时聊天。
用户能与这些有个性的角色进行日常对话或剧情演绎。应用支持文字和语音,提供角色定制,带来个性化的社交体验。
6. AI写真:星绘APP VS 可图小程序
星绘APP是抖音Flow部门推出的AI相机和图片生成应用,它使用AI技术为用户提供个性化的图片服务。用户可以上传照片或输入描述词,创建AI分身,并选择不同风格效果,如像素风、赛博朋克、日式漫画等。
星绘还提供写真模板、风格转换和扩图功能,让用户探索虚拟世界的生活场景。目前星绘免费,适用于Android和iOS设备。
快手可图大模型小程序目前支持单人写真、AI滤镜、AI盲盒等功能。
7. AI图片/视频生成
即梦和即创两大平台,为字节的AI营销创作提供了强大的技术支持。
用户可以利用这些工具快速生成营销所需的图片和视频,提高工作效率。
即梦AI是字节旗下的一站式AIGC内容专业创作平台,支持文生视频和图生视频,提供智能画布、故事创作模式、以及首尾帧、对口型、运镜控制、速度控制等AI编辑功能。
在今年的上海国际电影节上,抖音联合博纳影业出品制作的AIGC科幻短剧集《三星堆:未来启示录》正式亮相。
即创是抖音推出的一站式电商智能创作平台,提供AI视频创作、图文创作和直播创作三大功能,借助AI的能力节省短视频和直播的成本和时间,全方位满足短视频和抖音电商从业者的创作需求。
可图 KOLORS 是快手推出的免费AI图像生成平台,基于快手自研的文生图大模型“可图大模型”,参数规模达十亿级,支持文生图和图生图功能。
可灵是快手AI团队自研的视频生成模型,具有高级视频创作功能。使用3D时空注意力机制,能制作符合物理规律的动态视频,模拟现实世界。可灵能生成长达2分钟、1080p高清视频,并支持调整宽高比。
结合3D人脸和人体重建技术,它还能实现全驱动的表情和肢体动作,用户只需上传全身照,就能享受AI唱跳效果。
快手推出的星芒短剧《山海奇镜之劈波斩浪》成功落幕,作为国内首部AIGC原创奇幻微短剧,该剧得到了快手自研的可灵AI视频生成模型的深度技术支持。灵感来源于《山海经》,利用AI技术创作,既传承了中华传统文化的精髓,也为观众和行业带来了前所未有的视觉冲击。
8. AI营销创作平台:剪映 VS 快影
抖音和快手为推动增长,都加强了运营策略,推出了各自平台的视频编辑工具(如抖音的剪映和快手的快影),其中剪映功能特别全面。
剪映,一个集视频编辑和创作于一体的创作工具平台,其AI功能能够帮助用户轻松制作出专业级别的视频内容。
快影是一款易用的视频编辑应用,提供分割、裁剪、拼接等剪辑功能,以及丰富的音效和音乐库,包括智能配音和字幕添加,帮助用户制作生动有趣的视频。
它还提供多样的字幕、滤镜、美颜和背景选项,以及海量模板,让用户轻松创作出精美的视频。
此外,快影具备AI功能,如动漫效果生成、图片风格转换、绘画效果和文案库,支持一键生成和文案编辑,助力用户作品脱颖而出。
9. Agent应用:字节coze/扣子
Coze是字节跳动推出的AI聊天机器人和应用开发平台,类似于GPTs,允许用户无论有无编程背景都能迅速构建聊天机器人、智能体、AI应用和插件,并在多个社交平台和聊天应用中部署,如Discord、WhatsApp、Twitter、飞书、微信公众号等。国内版扣子(coze.cn)
国际版coze(coze.com)
Coze的国际版(coze.com)基于OpenAI的GPT、Anthropic 的Claude、Google 的Gemni,而国内版(coze.cn)使用豆包大模型及其第三方国产大模型,让用户能够创建自定义的聊天机器人。
10. AI教育产品:河马爱学
河马爱学APP是字节跳动旗下大力教育的在线学习平台,它利用自适应智能系统为师生提供个性化学习推荐、进度跟踪、AI答疑、知识讲解和作文指导。
该应用致力于提高学生学习动力和自主学习能力,同时利用AI技术辅助教育,成为学生的智能助手和家庭教育的得力伙伴。
11. AI音乐平台:海绵音乐
海绵音乐是字节推出的免费AI音乐平台,专注于创造个性化音乐。
链接:https://www.haimian.com/featured
在中文歌曲的人声处理上表现出色,减少了电音效果,提高了清晰度和流畅性,更贴近国内听众的喜好。
平台提供多种情感和风格,如治愈、怀旧、伤感、兴奋等,包括R&B、摇滚、嘻哈、电子等,支持用户互动和反馈。
12. 代码生成:MarsCode
豆包MarsCode是字节跳动推出的免费AI编程工具,提供云端IDE和VS Code/JetBrains插件。
基于豆包大模型,实现代码补全、生成和优化,支持云函数开发,并具备API测试、存储、部署及JSON Schema生成功能。
MarsCode扩展支持多种编程语言和IDE,提供代码编辑、解释、注释、单元测试和错误修复等辅助,提升编码效率和质量,适用于后端、前端和App开发。
针尖对麦芒:水与火的交锋
目前,字节基于coze/扣子打造属于自己的Agent中台,接入了第三方的大模型能力,coze平台能力也愈加完善,coze专业版目前支持矩阵式的Bot创建与分发,搭配火山方舟的模型矩阵能力,如种类丰富的豆包系列大模型,在不同应用场景,打通营销、获客渠道......
AI智能体搭建平台
火山方舟模型矩阵
快手,同样不甘示弱。快手以其独特的用户基础和内容生态,不断探索AI技术的深度融合与应用,力图在AI战场上占据一席之地。
快手公司的高级副总裁盖坤宣布,公司已构建了一个以快意语言、推荐、视觉生成等大模型为核心的技术矩阵,这些技术广泛应用于内容创作、理解与推荐等多个方面,并且深入服务于快手的商业生态系统。
利用快意大模型的视频脚本和直播脚本生成技术,结合数字人技术,快手为广告主提供了一种低成本、高效率的视频和直播内容生产方式,显著提高了广告转化率。今年6月,快手的AIGC营销素材使用量创下了单日2000万的新高,证明了大模型在商业领域的强大应用潜力。
快手的推荐大模型SIM,拥有高达十万亿的参数规模,跻身全球顶尖推荐系统行列。其新一代架构ACT预计将为快手App带来数亿分钟的日增观看时长,极大增强了用户的粘性和活跃度。
万鹏飞,快手视觉生成与互动中心的负责人,提到可灵AI大模型在最新版本中实现了运动生成、视频时长、物理规律、画质、指令响应等多个方面的性能提升,现在能够一次性生成更长、更清晰的10秒以上视频