微信扫码
与创始人交个朋友
我要投稿
在新加坡人的社交局里,一段能引发讨论的开场白,从买了什么NFT(Web 3.0术语,非同质化代币),转变为了OpenAI。
在当地有名的地标建筑金沙酒店,一名刚刚落地不久、还拖着行李箱的个人投资者告诉36氪,2022年在新加坡投资加密货币亏损几百万美元后,他离开了这个“伤心地”,转而飞到印尼看橡胶。
这次他愿意回来,是为了AI。
2024年6月5日和6日,为期两天的亚洲人工智能大会SuperAI,涌入了5000多人。“下南洋”的不仅有三大云厂商AWS、微软和谷歌,还有市值频超苹果的芯片巨头英伟达,以及争议和流量同时不断的Stability AI创始人Emad Mostaque。
前来参展的,有1000多家全球各地的公司,其中东南亚的AI企业,又占了半壁江山。
东南亚,在AI浪潮中是边缘化的存在,仅仅因为高性价比的土地,成为不少巨头公司筹建算力中心的所在。然而,这些在互联网中籍籍无名的存在,有仅靠2人运作的公司,有已经跑出几百万美元ARR(年度经常性收入)的企业。
其中,不乏有在Web 3.0泡沫中受挫的企业,试图在AI浪潮中再镀一层金。
曾经为“挖矿”(区块链交易的记账过程)而积攒了一批高端芯片的矿机厂商,摇身一变,成为面向AI企业的卖水人;一些AI项目,也瞄准币圈,用AI做管钱、理财的生意。
而更多企业,将新加坡作为找算力、钱和全球化市场的窗口。
2024年3月19日,新加坡电信(Singtel)宣布将在同年Q3在新加坡和东南亚提供英伟达H100等高性能GPU服务——其竞争力还在于,英伟达GB200 Grace Blackwell超级芯片的部署,首选于此。
丰富的算力资源、活跃的资本市场、人才优惠政策,以及天然的地理优势,吸引了一众企业聚焦于此。
比如猿辅导母公司旗下的AI设计业务Motiff,将出海首秀的舞台选在了这里。来自澳大利亚、泰国、英国的几家创业公司,在新加坡设立了办公室,作为进入亚洲市场的切口。
牛津大学学生的创业项目,也来到了新加坡。他们的Co-CEO Shawn总结:新加坡在Web 3.0积累下的优势,延续到了AI。
在人力资源丰富的东南亚,和降本增效相关的,往往都是全球化的好生意。来SuperAI的东南亚创业公司,已经开始用AI帮用户管好自己的钱袋子。
通过基于百万企业数据训练得出的AI模型,Betterteem对员工的辞职风险进行评估。一旦未来三个月内有离职意向的员工人数占到10%以上,系统就会对企业发出预警,辅助企业挽留人才,或提前招聘继任者。
一段让Taylor Swift开口说普通话的视频,让华人AI公司HeyGen的估值,在4个月内翻了6倍。
来自澳大利亚的AI公司Verbalate,做的便是和HeyGen一样的AI配音生意。Verbalate的展台没有任何员工值守,但一段让韩团BTS成员开口流利说英语的视频依然吸引了不少人。
想要和HeyGen打擂台,Verbalate的最大优势就是便宜。以HeyGen中定价最便宜的Creator版本为例,288美元/年的费用,最多可以生成180分钟的视频,折合1.6美元/分钟。而Verbalate的定价是1美元/分钟。
小而精的团队,是这波AI创业浪潮的一个特点。根据LinkedIn数据,ARR(年度经常性收入)已经超过2000万美元的HeyGen,约有40名员工。瞄准俄罗斯市场的竞争公司RASK,员工也有21人。
Verbalate则将小而精炼到了极致——这个还未开始商业化的公司,只有2名员工!
成立于新加坡的Lytehouse,则给家庭监控,装上了一个AI大脑。
Lytehouse认为,传统的常规自动警报系统存在滥报、误报的情况,增加出警成本的同时,也会造成人们对安全隐患的疏忽。
为此,Lytehouse训练了一个视频识别系统,支持用户根据现实情况手动设置多个高级规则、监测区域和时间范围,目的是为了尽量消除干扰因素,将误报率降低了99%,并能对监控进行识别、管理和调整排障。
这一识别系统工作的方式,是将不同品牌、型号的摄像机或安全系统,集成到Lytehouse的管理仪表盘上。网站的自定义规则引擎,还支持用户根据需求微调警报。
提出“AI”这一概念的人工智能之父John McCarthy的弟子,也携在新加坡成立的新公司FAIT,出现在了SuperAI。
创始人Aaron Hallmark发现,将应用程序部署到生产环境的系统集成过程是高度手动化的,耗时长又昂贵,一些企业在集成应用上的成本甚至是应用本身成本的10倍。
FAIT提供的解决方案,是用AI来实现应用的自动化部署和更新迭代,并将整个周期从几周缩短到几天。
AI驱动不仅能够驱动前期的数据映射过程(data spec),将源系统的数据自动映射为目标系统的数据,还能够自动将这些映射转化为执行代码。
在新加坡,Web 3.0经历了从烈火烹油,到臭名昭著的三年。频繁的暴雷事件让Web 3.0亟需一块挽回声誉、重振旗鼓的名片。2023年,Web 3.0等到了AI。
大模型只能是巨头的游戏?来自牛津大学的华人创业团队NeuroMesh说“不”!
在Scaling Law的暴力美学下,算力资源成了大模型训练的命脉。但全球约90%的算力资源在美国,其中,又以Meta、微软、Google等互联网巨头为算力大户。
那缺少算力资源的中小公司就难有翻身之日?NeuroMesh的解决方案是:众人拾柴火焰高,将分散在全球的算力资源集合起来,共同训大模型。
这一野心能够实现的技术基础,是牛津大学提出的PCN(预测编码网络)训练算法。与GPT等大模型采取的主流Transformer算法不同,PCN模仿了人类大脑的局部学习法,优势在于可以实现本地、并行和自主训练。
通俗来说,散落在世界各地的小公司根据有限的算力资源独立训练,最后再将训练成果结合在一起,就能创造一个天量参数的大模型,与巨头公司抗衡。
与此同时,PCN架构还能充分利用海量的消费级芯片资源。
NeuroMesh Co-CEO Shawn Ying对36氪介绍,H800等高性能GPU与4090等芯片在计算能力上并没有太大差距,核心的区别在于带宽,高性能显卡能够提高数据传输效率。而PCN恰好可以弥补消费级显卡的带宽劣势。
至于如何分配AI模型训练的果实,NeuroMesh请来了Web 3.0老朋友DePIN(去中心化物理基础设施网络)框架。通过推出一个分布式AI训练协议,NeuroMesh根据贡献度为参与模型训练的个人和组织分发Token。
除了交易行为,Investy.ai还能对用户名下的Portfolio(投资组合)进行分析、监控和评估,并且辅助决策。Investy.ai告诉36氪,目前平台能够让平均回报率比人为操作提高15%以上。
如果未来AI强大到能够管理股票和基金,可能黄浦江边不会聚满喝醉的股民……
算力,在Web 3.0时代可供挖矿,在AI时代亦能卖水淘金。
在东南亚,不少国家由于数字化建设起步晚、人口规模较小,在训练大模型上难以获得比肩中美的土壤优势。
但这里,又不乏因Web 3.0而囤了一批A100等高性能芯片的公司。而这些“矿主”,正在AI时代,通过算力租赁和售卖,延续财富梦。
Float16. Cloud是来自泰国的一个大模型部署平台,特点是:便宜大碗。
平台上的模型价格,最高不过0.9美元/百万Tokens,平均定价比OpenAI便宜了95%。
不过,GPU对于大部分亚洲国家而言,同样也是难以规模化的稀缺资源。Float16. Cloud在东南亚,能够部署的GPU也只有4608块左右。
Float16. Cloud提供的模型,优势还在于提供了懂泰语、马来语等亚洲语言的大模型API。创始人Matichon Maneegard提到,亚洲是个语言丰富的地区,但目前GPT等主流模型在小语种任务上的表现并不佳。
老币圈人,大都听过比特小鹿(BitMain)的名字。这家华人创立的数字货币矿机厂商,曾向全球区块链网络提供算力,优势在于高能效比的解决方案。
2021年2月,Bitdeer从矿池市场抽身,转而与各大矿池商合作扩大算力资源,转卖云服务。
而算力成为宝贵资源的大模型时代,Bitdeer摇身一变,又开始基于丰富的算力资产,提供AI云服务。
作为算力服务商,Bitdeer的核心竞争力还是低成本的电力获取能力。比如在2023年上半年,Bitdeer的平均电力成本大约为38美元/兆瓦时,远低于同期美国商业电价(2023年6月美国德州电价一度飙升到4500美元/兆瓦时)。
当然,当英伟达H100在中国大陆的价格已经涨到二三十万元,Bitdeer的算力服务定价就显得相当“美丽”:只需2.99美元/小时,就能无限访问H100资源。Bitdeer有底气说“无限”,是因为与英伟达达成了合作,成为首个在亚洲地区提供DGX H100 SuperPOD云服务的云服务厂商。
Bitdeer告诉36氪,目前已有不少大陆AI公司下了订单,其中不乏头部互联网大厂
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-12-26
Token已死?AI认知的新范式正在崛起
2024-12-26
字节和BAT,谁能缚住AI苍龙?
2024-12-26
大模型语义分析之嵌入(Embedding)模型
2024-12-26
Anthropic:高效构建AI Agent的最佳实践范式
2024-12-26
微软CEO纳德拉给出AI时代的关键答案:先有组织进化,才有技术突破(附视频)
2024-12-26
10分钟了解大模型应用全貌 : 大模型应用架构(LLM application architecture)
2024-12-26
聊聊 Anthropic MCP (Model Context Protocol ) - 本地如何配置试用
2024-12-26
FlashAttention原理,终于看明白了!
2024-05-28
2024-08-13
2024-04-26
2024-08-21
2024-07-09
2024-06-13
2024-08-04
2024-04-11
2024-07-18
2024-07-01