AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


Ollama 0.3.1-0.3.3 版本已推出
发布日期:2024-08-03 09:38:14 浏览次数: 1827 来源:二师兄talks


新模型介绍

  • Gemma 2 2B:这是 Google DeepMind 推出的一款全新的,参数量为 20 亿的模型。

    ollama run gemma2:2b

    0.3.1更新内容

    • 新增了对 min_p 采样选项的支持。

    • 现在,ollama create 命令能够在导入特定模型时,自动侦测并设置所需的停止参数。

    • 在 Windows 系统上,如果缺少必要文件,Ollama 会显示更为清晰的错误提示。

    • 修正了使用 /save 命令时,参数保存不正确的问题。

    • 现在,如果进行了工具调用,兼容 OpenAI API 的返回值中会包含结束原因为 tool_calls。

    • 使用 ollama pull 命令下载模型时,性能和可靠性得到了提升。

    • Ollama 的 Linux 安装脚本针对不支持的 CUDA 版本,会给出更为明确的错误提示。

    0.3.2更新内容

    • 解决了使用 ollama pull 时,下载进度无法继续的问题。

    • 修正了在旧版中运行 phi3 时出现报错的问题。

    0.3.3 更新内容

    • 现在,/api/embed 接口将返回包括总时长、加载时长和提示评估次数在内的统计信息。

    • 在与 OpenAI 兼容的 /v1/embeddings API 中新增了使用指标。

    • 解决了当提供上下文时,/api/generate 接口只会返回空字符串的问题。

    • 修正了 /api/generate 接口在返回上下文信息时的错误。

    • 现在,/show modefile 命令能够正确地显示 MESSAGE 指令。


    53AI,企业落地应用大模型首选服务商

    产品:大模型应用平台+智能体定制开发+落地咨询服务

    承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

    联系我们

    售前咨询
    186 6662 7370
    预约演示
    185 8882 0121

    微信扫码

    与创始人交个朋友

    回到顶部

     
    扫码咨询