微信扫码
与创始人交个朋友
我要投稿
HiGPT 是一种学习跨异构图谱的方法,不需要微调。它与新颖的图谱分词器和大量的图谱指令相结合,使其在适应各种数据分布方面表现出色。
标签:HiGPT
, 异构图谱
, 数据分布
原文链接见文末/1[1]
据报道,Meta的Llama团队仍在努力对齐,以使该模型放松并回答更多实际上并不具有争议性的查询。
标签:Meta
, Llama 3模型
, 人工智能
原文链接见文末/2[2]
一篇令人惊叹的论文将视频框架作为人工智能与人类用户交互的一种潜在更好的方法。它展示了视频模型可以用作规划器、代理、计算引擎和环境模拟器。以视频为基础的人工智能可以模拟现实世界,更好地支持人类决策。
标签:人工智能
, 视频技术
, 决策支持
原文链接见文末/3[3]
Dual Chunk Attention(DCA)扩展了大型语言模型(如Llama2 70B)的能力,使它们能够处理超过100k个令牌而无需额外的训练。它将注意力计算分解成块,增强了模型对短期和长期上下文的理解。
标签:Dual Chunk Attention
, 大型语言模型
, 自然语言处理
原文链接见文末/4[4]
Distilabel是为AI工程师设计的框架,使用人类反馈的强化学习方法(例如奖励模型和DPO)对大型语言模型进行对齐。 它主要专注于LLM微调和适应性。 Distilabel可协助数据收集,清洗和训练。
标签:Distilabel
, AI工程师
, 强化学习
原文链接见文末/5[5]
基于图扩散策略优化的药物设计增强了使用独特的强化学习技术的图生成模型,该方法承诺在创建复杂和多样化的图结构方面具有更好的性能,并可能在该领域树立新的标准。
标签:药物设计
, 强化学习
, 图扩散策略优化
原文链接见文末/6[6]
PromptMM是一种使用多模态知识蒸馏的在线购物推荐系统,可以改善像亚马逊和TikTok这样的平台上的推荐系统。它通过从各种内容类型(视觉、文本或声音)中蒸馏出重要特征,来解决用户偏好的不准确性,并简化系统,以防止过度拟合。
标签:PromptMM
, 多模态知识蒸馏
, 推荐系统
原文链接见文末/7[7]
Character AI公司的一种编码风格极大地提高了张量中形状的可读性。这种风格使用形状后缀来标识张量中的形状,例如“weights_2x3”表示形状为2x3的权重张量。这种命名约定使得代码更加易读和易于理解,特别是对于机器学习项目而言。该公司表示,这种编码风格已在其内部项目中得到广泛应用,并且计划在未来将其推广给全球的机器学习社区。值得注意的是,这种编码风格并不会影响代码的性能。
标签:Character AI
, 机器学习
, 编码风格
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-04-26
2024-05-14
2024-03-30
2024-04-12
2024-05-10
2024-07-18
2024-05-28
2024-05-22
2024-04-25
2024-04-26
2024-11-22
2024-11-22
2024-11-21
2024-11-20
2024-11-19
2024-11-18
2024-11-18
2024-11-16