微信扫码
与创始人交个朋友
我要投稿
TED(Technology, Entertainment, Design)是全球领先的演讲平台,以其汇聚世界顶尖思想者、涵盖广泛领域的深刻演讲而著名,推动了全球范围内的知识共享和创新。
我经常在TED上观看人工智能(AI)有关的演讲,了解AI的能力、潜力和风险。截至目前,已有超过550个AI主题相关的TED视频,最早可追溯到2007年!
在学习TED上AI相关内容时,我意识到这些内容可以帮助我了解AI技术及其应用的演变。
为此,我开展了有史以来最大规模的数据分析,以梳理和追踪TED上AI主题的演化趋势。我使用YouTube上TED官方找好发布的视频作为数据来源,结合大模型和大Python代码,构建了一个知识图谱并开始分析。
本文重点在于分析过程,图谱构建过程将在其他文章分享。
我们先了解下视频发布的时间趋势。
在2007年左右,当AI对大众仍是一个小众话题时,TED已经邀请雷·库兹韦尔(Ray Kurzweil)等AI先驱进行演讲,他因研究“奇点”而闻名,还有知名数字助理公司的Palm Computing的杰夫·霍金斯。
IBM的“Jeopardy!”挑战者Watson于2011年推出,是当时最大的AI事件。
在这一时期,AI的讨论是零星的,偶尔出现,但不是每年都有。
值得注意的是,到2012年,TEDx活动已经举办了数千场,所以要么内容没有集中在AI上,要么这些视频没有发布在YouTube上(或者现在已经被归档)。
2016至2017年间,AI在TED演讲中的关注度显著上升。
DeepMind的AlphaGo击败了围棋大师,它在2016年战胜世界围棋冠军李世石的。
与此同时,TEDx活动也在迅速扩展。到2017年,TEDx的演讲已超过10万场,AI主题吸引了许多新兴社区的演讲者。
2017至2019年间,AI相关的TED演讲数量大幅增加。
这是多个因素共同作用的结果。深度学习和神经网络研究在这一时期取得了重大进展,同时科技公司和风险投资加大了对AI初创企业的投资。
当时,数据科学成为热门职业,大数据也成为焦点话题。AI技术在Gartner新兴技术炒作周期中达到顶峰,反映了公众对AI的热情。
技术进步、资金增加、专业知识增长和公众兴趣高涨,这些因素促使更多AI相关讨论出现在TED演讲中。人们看到了AI对社会和产业的影响,TED成为探讨这一转变的重要平台。
2020至2021年间,TED主频道的重点转向了医疗、远程工作和COVID-19疫情对社会的影响。
尽管AI不是主要话题,但在讨论应对疫情挑战的技术解决方案时,AI仍是一个重要的潜在主题。
2022年底ChatGPT的发布重新点燃了人们对AI的兴趣,尤其是对大模型的关注。2023年和2024年,AI和大模型成为TED演讲的核心话题。
演讲者们讨论了这一技术的潜力、机遇,以及它对社会的影响和潜在风险。
时间线展示了TED演讲中反映的AI趋势和事件
从谷歌指数可以看出,ChatGPT发布后,大众对AI的兴趣急剧上升,现在才稳定在比ChatGPT出现前高出十倍的水平。
“人工智能”词条在谷歌的趋势图
除了视频数量和发布时间外,我们再看看还能从视频中发现什么。
接下来,我将深入挖掘这些视频的字幕和元数据。我的分析涉及提取关键概念(如主题、人物、机构等),并对视频进行分类,以构建知识图谱。
通过这些分析,我们可以了解主导TED AI视频的主题、人物和机构,并深入洞察AI时代精神。
最常见的50个词语
AI类似电力或互联网,具备影响各行各业的潜力。这在视频数据集主题中得到了体现。
AI可能影响生活的方方面面,包括商业、社会、医疗、教育、工作、艺术和娱乐等。除了这些新兴应用,视频中还探讨了伦理、治理、安全等广泛问题。
从分布上看,大约55%的视频主要探讨AI的机遇,45%的视频关注AI的风险,相对平衡。
例如,有126个视频专门讨论AI与商业/工业。另一方面,113个视频关注AI对社会的影响、99个视频关注AI伦理与治理。
这种平衡在关注医疗(63个视频)和教育(55个视频)中也类似,同时也有关注未来工作(36个视频)。即使是较小的主题,这种平衡也依旧存在。
按主题划分的TED视频
上图从上到下分别是:商业/工业中的AI(126),社会中的AI(113),AI伦理和治理(99),医疗中的AI(63),教育中的AI(55),未来工作的AI(36),AI发展和安全(25),娱乐中的AI(24),AI与安全(8),其他(4)
比起抽象的趋势和概念,了解AI领域中的人物,有助于更深入地理解我们在视频中看到的内容。因为这些人物将是那段AI历史的重要组成部分。
视频中频繁提到的关键人物可以分为三类:
1. 技术思想领袖:在AI领域具备开创性贡献和思想领导力而。如艾伦·图灵、斯蒂芬·霍金、雷·库兹韦尔、马文·明斯基。
2. 商业领袖:在商业世界中因其对AI/技术的采用和应用有重大影响。如埃隆·马斯克、比尔·盖茨、马克·扎克伯格、史蒂夫·乔布斯)。
3. 受AI影响的其他领域专家:在其领域因AI进步而受到深远影响的专家。如棋界大师加里·卡斯帕罗夫、围棋冠军李世石、艺术家米开朗基罗。
按视频数量统计的18位最常被提及人物
上图从上到下依次是:埃隆·马斯克(45),艾伦·图灵(24),斯蒂芬·霍金(21),比尔·盖茨(15),克里斯·安德森(13),雷·库兹韦尔(13),加里·卡斯帕罗夫(13),李世石(9),马克·扎克伯格(9),马文·明斯基(9),史蒂夫·乔布斯(7),约翰·麦卡锡(6),尼克·博斯特罗姆(6),德米斯·哈萨比斯(5),亨利·福特(5),米开朗基罗(5),萨尔·汗(5),扬·勒昆(5)
尽管这些名字中的大多数都广为人知,但其中有几个我不得不进行研究,这份大名单几乎像是一场“AI名人知多少”的问答。
机构在AI的发展中同样扮演着重要角色。尽管最常被提及的机构名单可能不会让人惊讶,但它确实突出了过去17年TED视频的变化。
• Google被提及的次数几乎是第二名的两倍,即使将其收购的DeepMind视为单独实体。
• OpenAI尽管是新兴公司,但已经迅速获得了显著地位。
• MIT和斯坦福大学是AI研究和发展的领先学术机构。
• IBM、亚马逊和Meta在最新的大模型浪潮中被提及较少。提及他们的内容,超过80%的都在2022年前。
各机构多年累积视频数量
上图从上到下依次是:特斯拉(11),苹果(14),斯坦福大学(21),Facebook/Meta(24),IBM(26),DeepMind(29),亚马逊(30),MIT(34),微软(36),OpenAI(53),Google(94)
与个人相比机构的惯性更大。因此我们将在未来许多年内看到Google、微软、MIT、亚马逊、OpenAI等机构的身影。
但是并不意味着不会出现有影响力的新兴机构,但它们或被大公司收购(例如,Google收购DeepMind)。
对于这一趋势,17年的时间窗口可能还不够长。
这些TED演讲提供了一个观察AI的视角,反映了AI从一个小众话题,逐渐转变为社会变革力量的过程。
随着AI的不断发展,TED将继续成为理解其潜力、挑战和围绕其发展的重要资源。单个演讲者和视频本身已经非常有影响力,但将它们汇总分析揭示的趋势增强了我们对AI的理解。
AI的故事仍处于早期,观察这些趋势如何演变,以及在这个动态领域中会出现哪些新话题非常有趣。
视频数据集:https://gist.github.com/garygeo-19/1240a9e6b5aba36efcf13894f119f54e
搜索AI相关视频的应用:https://garygeo-19.github.io/AI-TED-Talks-KG/
作者创建的运用。顶部是搜索栏,下面是缩略图、关于浏览/点赞/评论/时长的统计信息,然后是包含可点击的实体和概念标签,如Elon Musk,AI在医疗中的应用等)
截至2024年5月的数据集由作者手动生成,可能存在错误或选择不一致,并且部分TED视频未在YouTube上发布,因此不完全覆盖所有内容。
分析涵盖了主TED频道、TEDx、TED-Ed以及已不活跃的TED Institute频道,提供了广泛的话题视角。数据提取和分类通过OpenAI的ChatGPT-4完成,可能也存在一些误差。YouTube数据显示,由于早期发布的视频有更多时间积累浏览量、点赞和评论,这些指标可能有所不同。
分析方法说明
以下是我进行此分析的方法。我计划在未来撰写一篇关于这一过程和技术的单独文章。
1. 确定YouTube并建立了截至2024年6月1日的相关视频播放列表。
2. 使用API和Python收集YouTube元数据和字幕。
3. 在Python笔记本中处理数据,包括字幕摘要、概念提取和分类。这是通过OpenAI API(即LLM)完成的。
4. 结果存储在包含3500多个节点和11000个关系的知识图谱中。
5. 手动审查捕获的节点和关系以消除问题/错误,并合并相似概念(如Stanford和Stanford University等)。
6. 创建有助于分析的数据集(例如,按年份/频道的视频计数,按人物的视频计数等),然后创建可视化图表。
7. 将这些知识图谱数据加载到一个JSON文件中供Web应用使用。
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-11-13
GraphRAG:基于PolarDB+通义千问+LangChain的知识图谱+大模型最佳实践
2024-11-13
利用LLM Graph Transformer实现知识图谱的高效构建
2024-11-12
什么是知识图谱和AI多模态推理
2024-11-12
Graph Maker:轻松使用开源大模型将文本转为知识图谱,发现新知识!
2024-11-11
iText2KG:使用LLM构建增量知识图谱(KG)
2024-11-08
NebulaGraph 在中医药领域的应用:构建鼻炎知识图谱
2024-11-07
轻松搭建AI版“谁是卧底”游戏,muAgent框架让知识图谱秒变编排引擎,支持复杂推理+在线协同
2024-11-06
GraphRAG 0.4来袭:增量更新+DRIFT,起飞~
2024-07-17
2024-07-11
2024-07-13
2024-08-13
2024-07-08
2024-07-12
2024-07-26
2024-07-04
2024-06-10
2024-06-24
2024-11-04
2024-10-10
2024-10-03
2024-09-27
2024-09-08
2024-09-05
2024-08-27
2024-08-24