AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


AI产品分析:百度网盘——文心大模型加持的AI智能助理,如何把网盘“重做一遍”?
发布日期:2024-04-12 06:55:32 浏览次数: 2008




在之前的文章中,我们对腾讯、阿里的相关AI产品都有探索:

接下来我们研习另一家中国互联网巨头百度在AI大模型领域的实践应用:百度网盘。


声明:我这属于自干五,BAT可都没有给我打钱o(╥﹏╥)o


百度要做第一个把全部产品重做一遍的公司,不是整合,不是接入,是重做,重构!

百度·李彦宏

引言


在人工智能的浪潮中,大模型技术如同一股强劲的潮流,正重塑着我们的工作和生活方式。百度,作为中国的传统互联网巨头之一(尽管有所“没落”),早已宣布全面拥抱大模型技术。百度推出的文心大模型,虽然与GPT等国际领先的大型语言模型(LLM)相比存在较大的差距(甚至其表现为不少国内网友所“诟病”),但通过持续的技术积累和创新实践,在2023年11月17日召开的百度世界大会,百度搜索、网盘、文库、地图、如流等数十款百度AI原生应用集中以全新面目亮相,在智能化服务的道路上迈出了坚实的一步。

据悉,百度网盘个人用户数已超过8亿,企业客户超过30万,总数据规模达到千亿GB。
百度网盘推出的“云一朵”智能助理,标志着传统网盘服务的全面升级。作为国内首个基于大模型的网盘智能助理,“云一朵”不仅仅是一个文件存储工具,它结合了文心大模型的强大能力,能够理解和执行用户的自然语言命令,从而在工作、学习和日常生活中为用户提供前所未有的便利和效率。


01

产品概览


“重做”之后的百度网盘,通过云一朵智能助理,能够支持视频智能配字幕、音视频智能转文稿、视频转课件、智能扫描、描述特征搜索网盘图片等,当然常规的问答、总结、创作、翻译等常见的“chatBot”功能也不在话下。

个人用户的智能助手


面向个人用户,百度网盘借着AI技术和文心大模型的能力,为多种场景赋能:

工作场景:无论是处理英文报告、专业论文,还是创作新文档,“云一朵”都能提供智能摘要、翻译、甚至内容创作等功能,显著提升工作效率。

学习场景:对于学习资料,“云一朵”能够添加字幕、导出文稿、生成课件、提炼重点,甚至直接回答相关问题,使学习变得更加高效和深入。
生活场景:在日常生活中,“云一朵”可以帮助用户快速查找照片、发票或其他文件,极大地节省时间和精力。

企业用户的数字资产管家


除了个人用户,百度网盘也面向企业级用户提供了相关的AI解决方案:

  • 知识管理解决方案:百度网盘企业版为企业提供了从信息化管理到知识化管理的转变,通过智能分类和内容总结,增强企业知识的使用和流转效率。
  • 行业定制解决方案:针对电商、摄影等特定行业需求,百度网盘推出了更加垂直的解决方案,如AI修图、即拍即选服务,助力行业客户提升工作效率和服务品质。
  • 智能硬件解决方案:百度网盘还与多种硬件设备进行了深度整合,使得用户可以在任何设备上访问和管理自己的数字资产,无缝连接线上线下体验。

不过企业版一般体验不到。我们接下来还是重点体验和分析个人版的功能。
目前AI加持的功能特权需要SVIP才有资格体验(部分限时免费可体验):

出于学习和研究之需,百度网盘成为了我为数不多的、多次付费的互联网产品
上车!!!
接下来就请随我一起探索一番。


02

我的上手体验


在此先分享下促使我下定决心为百度网盘付费的不同动机:

  1. 第一次付费,源于对知识的渴求(哈哈)。当我获得了一批充满洞见的课程视频,我迫不及待想要沉浸其中(哈哈哈),而非会员的下载限速和无法倍速播放的限制(都是产品经理设计的套路,我懂),似乎成了阻碍我探索知识海洋的障碍。于是,我选择了成为会员,以便能够即刻享受学习的乐趣。

  2. 本次付费,源于当我再次获得了一大批宝贵的视频资源时,我发现了“云一朵”智能助理的一项神奇功能——直接生成课件!在过去,每当我在视频中遇到觉着不错的内容,我总是通过截屏来保存。然而,“云一朵”为我提供了一种全新的学习方式,它能够直接从视频中提取课件。这种方式不仅节省了我的时间,更以一种高效、直观的形式,帮助我整理学习资料。对我而言,“云一朵”的这项功能不仅“香”,简直是学习效率的“加速器”!

基本入口


首先我们看到“云一朵”网盘智能助理的入口非常明显:

(1)PC端是在网盘的右上方悬浮着:

(2)手机端则更加突出,在底部一级导航居中的位置:

点击进入,不难发现:

(1)logo上带有“测”字标识,目前仍然处于“测试”阶段,不是十分成熟。但这并不妨碍百度网盘这款产品借着这些新的“智能”功能创收,吸引像我这样的付费会员

(2)界面和ChatGPT、文心一言的界面基本相似,只不过在和网盘结合之后,PC端是固定在右侧作为“网盘”的一部分(在移动端则是作为独立界面,样式就可以基本复用了)

非会员每天也是有20次的免费“对话”可以体验的,我付费升级为V2会员后变成了每天100次:

根据官方文档:

1. 成为百度网盘超级会员,即刻享有百度网盘云一朵智能助理的贴心服务。通过与云一朵交流,可为您解答文档和视频内容相关问题,还能根据您的描述帮您快速找到网盘内的文件。

2. 说明:现仅支持不超过150M的非影印版的PDF、Word、PPT等主流文档格式以及时长在5分钟以上的视频(目前仅在Web和windows端最新版网盘视频播放器内可使用此功能)。该特权现阶段限次使用,SVIP1-9用户100次/天,SVIP10用户无限次数享用。

接下来我们将以PC端为主,进行相关操作体验分享。

基于网盘内容(文档/视频)的对话


在这种情景下,我们可以把它理解为带有知识库的GPTs(即ChatGPT+网盘内容资源),它既可以针对指定的视频进行智能对话交互,也可以进一步联网扩展获取补充信息。

例如让它直接提炼视频大意(相当于速读):

除了能够准确概括视频的内容大意(这个在B站上比较常见,如下图)我们可以看到在总结文本的后面还会带上附加的3个推荐问题,方便用户直接点击继续进行多轮对话。这对于学习场景而言还是很实用的。

不过对比起来的话,我觉得不如B站的AI视频小助理做得好,因为B站上的是直接结合视频的时间轴进行的概括,看起来更加直观和清晰

如果我们直接针对视频发起相关提问,智能助理除了会结合视频内容做出回复之外,还会指出对应内容出现在视频中的位置(这个就和B站的功能相似了,不过更接近于我们此前分析过的腾讯会议的章节标注功能)。

点击对应的参考时间点,视频会自动定位到该播放位置,这有助于用户快速定位到感兴趣的内容。

智能助理支持根据视频自动生成字幕和文稿。这一功能在如Youtube、B站等视频平台上早已司空见惯,然而在百度网盘中体验却有所不同。我注意到,每当我尝试生成字幕或文稿时,系统会提示需要等待几分钟。起初,这种等待与即时展现的字幕形成了鲜明对比,引起了我的好奇。

经过一番思考,我认为这种“等待时长差异”的原因,可能与视频的处理时机有关。视频平台在用户上传视频的同时,就开始进行预处理工作,包括字幕的自动生成和语言选项的准备,因此当观众需要时能够立即呈现。相反,百度网盘作为一个以存储和分享为核心的平台,并非专注于视频内容的加工处理,因此在用户请求时才开始实时处理视频,从而产生了一定的等待时间。

值得一提的是,尽管当前许多直播平台已经能够实现实时双语字幕的生成,这表明AI技术在实时语音识别和翻译方面已经取得显著进步。然而,对于已经存储为文件的视频资源,实时处理仍然是一个相对耗时的过程。

文稿即是完整的字幕,在百度网盘中是一份完整的内容,

而在Youtube中则是按照时间轴逐句表示的:

至于哪种模式更好?我觉得取决于用户的需要。就从日常学习和工作的角度而言,我认为百度网盘的这种模式是符合它的定位的,因为用户可以直接将文稿通篇复制出来之后再加以整理、修改。

智能助理支持根据视频自动生成课件这一创新无疑为知识获取和分享提供了更为高效的途径。当用户观看教育和学习类视频时,能够通过这一功能直接提取视频内容,生成结构化的PPTX课件,极大地节省了整理和归纳信息的时间。

生成后的课件支持下载,默认下载到当前视频所在网盘文件目录下,文件格式为PPTX:

对于生成的课件,用户可以更有针对性地进行显式反馈:

从实际使用的用户角度来看,这项服务并非完美无缺:

  • 用户在使用过程中需要耐心等待几分钟,这或许对于追求即时服务的用户来说是一大考验。

  • 对于课件的生成,百度网盘采取了会员等级制度,不同等级的会员享有不同的生成次数,这一设置在一定程度上限制了用户的使用体验(得加钱)。

  • 并非所有视频都适用于课件生成,这一限制或许源于技术层面的考量(比如视频本身是用word文档讲解的是不支持生成课件的),但若能对支持格式进行拓展,如添加对DOCX或PDF等常用文档格式的支持,将使这一功能更加实用和广泛。


智能助理的笔记功能服务为用户提供了一种全新的视频学习体验。这项功能允许用户在观看视频时,通过简单的操作即可记录视频中的精彩时刻,包括时间标记和视频截图,使得学习和回顾变得更加便捷高效。

  • 时间标记的便捷使用:时间标记功能让用户轻松记录视频中的关键点。当遇到视频中的精彩或重要内容时,一键点击便可将当前的视频时间点添加到笔记中,形成一个时间标记。这些标记不仅在笔记中以图标形式展示,便于快速回访,而且还会在视频的进度条上显示对应的小圆点,直观地指示出标记的位置。点击进度条上的时间标记,笔记将自动打开,并且视频会自动跳转到该时间点,极大地方便了学习和复习。

  • 视频截图的高效整合:视频截图功能让用户可以随时捕捉视频中的重要画面,并直接保存到笔记中。这一操作免去了使用第三方截图软件的麻烦,令笔记整理过程更加流畅和高效。

对于学生党而言,应该是非常实用的工具了。所以也可以看到百度网盘官方在积极招募校园大使,抢着用户心智、培育“付费”群体:

笔记会自动保存到网盘当前目录下,

打开可见是网盘独有的格式(类似于腾讯文档这类在线协作文件),可以继续编辑、分享(如果能支持导出就更好了):

高清倍速的功能也是我使用较多的,不过和大模型没啥关系:

其余的功能,和ChatGPT、文心一言等AI大模型chatBot就比较相似了,例如上传图片/截图进行解析和对话

比较有特色的是这种了,根据视频出题

更多的集成功能,就是类似于GPTs的直接使用了:

想来是官方团队在文心一言的积累基础上,挑选&额外自定义了这些产品团队认为适合在百度网盘中使用的预定义的、个性化的“小工具”:

当然在“对话”的过程中,也不难发现还是存在大模型对话助理的常见问题,例如答非所问



03

更多亮点功能


在探索的过程中,我发现百度网盘还提供了不少其他非常实用的AI辅助功能或工具支持。尽管这些功能我并不常用,但偶尔有需要时(例如pdf转word)却是求之不得的,这反而是让我惊喜的地方。


AI看功能,支持用户通过简单地粘贴网页链接,就能够快速创建“快看”,这一过程涉及到智能摘要的生成、信息的分段总结,以及思维导图的创建。

支持的内容源非常广泛,包括百度搜索、微信公众号、知乎、小红书、虎嗅以及各类新闻网站等,这意味着用户可以对几乎任何公开的网络内容使用AI看功能,极大地扩展了其适用范围。

AI工具箱包含了一系列旨在提升用户效率和处理各类文档任务的工具,例如:

  • 图片转Word:用户可以上传图片,AI工具将图片中的文字转换成可编辑的Word文档,便于文本的进一步处理和编辑。

  • 文字识别:通过OCR技术,这个工具可以识别图片中的文字内容,并转换成电子文档,适用于扫描件或截图中的文字提取(如果从简单易用而言,不及微信直接的“提取文字”)

  • AI修图:为用户提供简单的图像编辑和优化功能,比如一键美颜、背景替换等,适用于个人和商业用途的图片处理(官方宣传是影楼的专业修图工具,小白秒变后期大师,女生福利呀)

  • 图片压缩:能够对图片进行压缩,减小文件大小,同时尽可能保持原有质量(例如设计的icon或banner图片尺寸较大,可以压缩后提供给前端使用,此前我是通过其他在线工具压缩)

  • PDF转Word:将PDF文档转换为Word格式,使用户可以编辑PDF文件中的内容(我为孩子处理小学生作业时,折腾过好几次)

  • 图片转PDF:允许用户将图片文件转换为PDF格式,以便统一打印或分享。

  • 图片转Excel:识别图片中的表格并将其转换成Excel文件,方便数据的进一步分析和处理(我在前2年时经常干这个事,将网络上获取到的图片中的数据提取到excel中再进一步整理加工)

我所截的图中有PC端的,也有手机端的,不难发现2者之间的交互/支持特性会有所不同。本文不再一一展开,感兴趣的读者可以自行体验。


04

产品实现过程推演


倘若我们就是百度网盘的产品经理,在接收到来自李厂长的“用大模型把全部产品重新做一遍”的指示后,要推动像“云一朵”这样的智能助理功能实现,想来大致需要开展以下工作:

(1)市场和用户研究:

识别目标用户群体和市场需求。

进行竞品分析(不一定是直接竞品,参见产品经理的文档模板(4)产品对比),确定“云一朵”智能助理的独特价值和差异化功能

(2)定义产品愿景和战略:

基于研究结果,定义产品愿景、使命和长远目标(参见产品经理的文档模板(1)产品战略

设立阶段性目标和关键结果,如用户增长、用户活跃度、收入目标等(参见产品经理的文档模板(3)产品OKR

(3)功能规划和优先级排序:

与用户体验设计师、技术团队合作确定功能范围。

制定功能地图和产品路线图(参见产品经理的文档模板(2)产品路线图Product Roadmap),确定MVP(最小化可行产品)的功能集。

(4)技术可行性分析:

了解文心大模型的AI能力和边界,评估现有技术基础设施是否能够支持所规划的AI功能。

与工程团队合作,评估可能的技术解决方案和开发框架。

(5)原型设计和用户测试:

开发初步原型,进行内部测试和用户测试,收集反馈。

基于用户反馈迭代原型,直至达到满意的用户体验。

根据信息,百度网盘于2023年5月27日宣布“云一朵”智能助理开启内测,用户可通过百度网盘 PC 客户端(最新版)或网页版进行预约。而最终面向大众发布的(收费)版本,已经是10月份了。这中间经历了5个月左右的时间。

(6)合作与合规:

确保产品符合数据隐私和安全法规要求。

探索合作机会,例如与WPS合作支持课件生成、pdf转word等。

(7)开发和迭代:

制定详细的产品需求文档和技术规范(参见产品经理的文档模板(5)人工智能/机器学习产品需求文档 AI/ML PRD)。

管理产品开发过程,确保按时按质完成开发任务。

(8)测试和质量保证:

对智能助理功能进行全面的测试,包括单元测试、集成测试和用户接受测试。

优化性能,修复bug,确保产品稳定性和可用性。

(9)上市前准备:

制定市场推广计划,包括营销活动、公关事件和用户指南。

准备技术支持和客户服务工作,确保用户问题可以得到及时响应。

(10)发布和市场反馈:

正式发布产品,监控市场反应和用户反馈。

基于市场反馈进行产品调整和功能增强。

(11)持续优化和扩展:

根据用户行为数据和反馈持续优化产品。

规划和实施新功能的开发,以持续增加用户价值和提升市场竞争力。

在整个过程中,产品经理需要密切协调跨部门团队的工作,确保产品开发与公司的整体战略保持一致,并持续跟踪产品性能指标,以确保项目的成功实施。

本小节的内容仅为个人推演,不代表百度网盘团队实际的工作情况。


05

总结与延伸


在人工智能的赛道上,百度的努力和成就是显而易见的。尽管在过去,百度曾因全家桶推广、魏则西事件等问题面临诸多质疑,其在国内互联网界的口碑遭遇挑战(我本人也不喜欢使用百度搜索查找内容),但这并未阻碍它在AI领域的深耕与探索。


随着云计算和人工智能技术的不断成熟,市场上对于智能化工具的需求正在快速增长。用户不再满足于传统的文件存储和分享功能,而是寻求更高效、更智能的工作方式。在这样的市场背景下,百度网盘推出的“云一朵”智能助理等AI特性,正好迎合了这一趋势,扩展了网盘的功能范围,提升了其市场竞争力。

百度网盘的目标用户群体十分广泛,从普通消费者到专业人士,再到中大型企业,都在寻求提升工作效率和降低成本的解决方案。百度网盘通过集成AI特性,尤其是针对内容创作者、学习者和信息工作者的需求进行了优化,满足了他们对于高效信息处理和内容创作的需求。通过整合AI特性,百度网盘不仅提升了自身产品的价值,还能够为用户提供独特的服务,从而在竞争中脱颖而出。

智能化服务的引入为百度网盘打开了新的业务机会。例如,“云一朵”智能助理的推出,可以吸引那些对AI感兴趣的用户,增加用户粘性;加上AI工具箱等增值服务,提供付费功能,为百度网盘创造新的付费会员转化利益点。长远来看,数据的积累和用户反馈也将促进百度网盘服务的持续改进和个性化,进一步增强其在市场中的竞争力。

不过,这样做的可不仅仅是百度网盘。例如夸克就在刚过去不久的1月19日,凭借自研大模型能力,在其App中全新升级多个功能板块和智能工具,推出搜索问答产品“元知”,上线夸克PC版以及夸克听记等新产品。

夸克此前只是提供移动端的APP服务,在今年1月初也上线了PC版。

夸克PC版主要特点:
1. 强大的搜索引擎功能:夸克PC版保留了移动端的核心搜索功能,提供了快速准确的搜索服务。用户可以通过简洁直观的界面,快速找到所需的信息。
2. 集成网盘服务:夸克PC版浏览器集成了网盘功能,用户不仅可以便捷地管理和浏览在线文件,还能实现跨设备的无缝文件同步。
3. 工作学习必备的智能助手:资源检测、一键翻译、音视频智能调节倍速画面,各色多功能插件等你探索。
4. 强大的文件工具中心:文件轻松查看、编辑及备份、多端同步,一键office互转,高保真还原排版。
5. 跨平台体验:夸克PC版支持与移动端账号,资产一键同步,跨设备流畅使用,支持书签、密码、资产多端,大文件无损传输。无论用户在哪个设备上,都能保持浏览数据和个性化设置的连续性。
夸克网盘作为后来者,可能在市场占有率和品牌知名度上不如百度网盘,但它无疑也在努力尝试吸引更多的用户、向百度网盘发起挑战。至于结果如何,让我们拭目以待。
期待在未来,百度能继续推出更多人性化、智能化的产品!我也会继续抽空研习百度所说的其他已经基于文心大模型和百度AI底座进行“加持和重塑”的产品,例如百度搜索、百度文库、百度地图、百度如流等。




53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询