听说最近大模型的数据分析能力大幅提升,作为一名曾经的数据分析师,还是比较感兴趣。下面是针对ChatGPT 4o、Claude 3.5 Sonnet做的一个简单测试,效果如何大家自己品评。
Claude 3.5可以直接导入数据,并且有一个专门的Artifacts交互窗口来展示数据,如下所示:ChatGPT 4o调用python来导入表格数据,如下所示:在这个专门的操作窗口可以选择特定的区域提问,比如问选定列的平均值多少,这个非常便利,如下所示:针对上面导入的数据,Claude 3.5给出了对这些数据的几点观察,挺不错,如下所示:Claude 3.5基于Artifacts交互窗口给出了概貌,如下所示:ChatGPT 4o调用python给出了以上数据的一些基本统计值,常规操作,如下所示。基于以上数据,Claude 3.5给出了贴心的清洗转化建议,不错,如下所示:相对于Claude 3.5,ChatGPT 4o的表现差强人意,如下所示:让Claude 3.5基于以上数据表格给出一个数据分析报告,比较惊艳,结果如下所示:数据分析报告的图表是单独在Artifacts窗口展现的,直接可以交互,非常好,如下所示:ChatGPT 4o基于以上表格数据给出的数据分析报告,比较呆板,相比Claude 3.5有明显的差距,如下所示:Claude 3.5还提供了一个强大的功能,就是解析图表。针对输入的一张带有图表的图片,Claude 3.5可以智能的将图表中的数据读成JSON格式。基于JSON数据,可以要求重新画出交互的漂亮图表和相关分析,强大,如下所示:这个功能在很多场景非常有用,比如我看到某个图表很有用,希望将其中的数据嵌入自己的报告,这个时候就可以利用这个功能,下面示例了2个案例:案例三:2012-2018上半年中国网络游戏用户规模及占比情况ChatGPT 4o现在也具备了该能力,但距离Claude 3.5有差距,比如针对案例一,其识别出的数据明显不准确,200602的离网用户数被识别为了52000,但肉眼可见的数据应该在70000以上。
针对案例二,把国家“埃及”识别成了“坦桑尼亚”。
简单的测试结束。应该来讲,两个大模型都表现出了一定的分析潜力,特别是Claude 3.5 Sonnet,已经有初级数据分析师的味道了,特别是Artifacts协作空间很好,可以直接展示动态图表,图表解析功能的实用性也很高。而ChatGPT 4o报错太多,表现差强人意