我要投稿

近乎免费的 Gemini Flash，有了结构化输出

发布日期：2024-08-31 13:08:39 浏览次数： 2295 作者：赛博禅心

本篇内容核心：Google Gemini 1.5 Flash 已支持「结构化输出」，非常经济实惠

官方文档还没出：为了方便大家使用，我写了个 Sample Code，放在了下方

Logan 是原 OpenAI 开发者关系负责人

后去了 Google，也是负责开发者关系

「格式化输出」很重要

上一篇中讲到：结构化输出，是绝大多数 AI 产品和 Agent 的核心，无论是 AI 搜索、有记忆的 bot，还是各类 agent，都是基于结构化输出搭建的。

在上一篇中，你可以看到有关的起源、原理、用例，以及如何用它来搭建一个 AI 项目，这里就不再赘述：

看完这篇，你也能做 AI 搜索：论「结构化输出」

通过结构化输出，可以让 AI 输出一份思维导图或者表格：

而不是成篇的文本：

史蒂夫·乔布斯，1955年2月24日出生，2011年10月5日去世，美国人。他活跃于科技、创新、企业管理和动画领域。乔布斯创立了Apple、NeXT和Pixar公司，推出了Mac、iPod、iPhone等具有划时代意义的产品，重塑了个人电脑、音乐和手机行业，奠定了苹果在全球科技领域的领军地位。作为Pixar的创办人之一，他也在动画领域留下了深远的影响。乔布斯是20世纪末至21世纪初最具影响力的企业家和创新者之一。

Gemini Flash 的结构化输出

Google 家之前也有结构化输出，不过是在他们的贵的模型，Gemini 1.5 Pro 上面

而这次的更新，可以让廉价模型 1.5 Flash 也用上了：

100 万 token 的上下文
每天前 1500 个请求免费
调用价格低至 $0.075 每 100 万 token（长度少于 128k 的上文）
可叠加 GCP 的赞助/优惠
四舍五入不要钱
智谱的 Flash 是完全不要钱

相信做 AI 项目的同学都知道这意味了什么：这便宜大碗，而且 AI 味不重的 Flash，可正儿八经用在决策 workflow 了！

每天 1500 个免费请求

超出部分低至 $0.075 / 1M，外加项目折扣

Sample Code

目前，官方的调用方法还没出（会在本周末更新），但我可以给大家提供一份 sample code

我们把上一篇《看完这篇，你也能做 AI 搜索：论「结构化输出」》中，“将四大名著的信息进行结构化输出”的例子拿来做对比，通过 GPT，代码这么写

from pydantic import BaseModel
class theBook(BaseModel):name: strwriter: str
class theFour(BaseModel):books: list[theBook]
completion = client.beta.chat.completions.parse(model="gpt-4o-2024-08-06",messages=[{"role": "system", "content": "Extract the event information."},{"role": "user", "content": "告诉我四大名著分别是什么，以及他们的作者是谁"},],response_format = theFour,)
response = completion.choices[0].message.parsed

得到的结果是

theFour(books=[theBook(name='《红楼梦》', writer='曹雪芹'), theBook(name='《西游记》', writer='吴承恩'), theBook(name='《三国演义》', writer='罗贯中'), theBook(name='《水浒传》', writer='施耐庵')])

而通过 Flash，代码是类似这样的

"""Install the Google AI Python SDK
$ pip install google-generativeai$ pip install google.ai.generativelanguage"""
import osimport google.generativeai as genaifrom google.ai.generativelanguage_v1beta.types import content
genai.configure(api_key=os.environ["GEMINI_API_KEY"])
# Create the modelgeneration_config = {"temperature": 1,"top_p": 0.95,"top_k": 64,"max_output_tokens": 8192,"response_schema": content.Schema(type = content.Type.OBJECT,enum = "[]",required = "["books"]",properties = {"books": content.Schema(type = content.Type.ARRAY,items = content.Schema(type = content.Type.OBJECT,properties = {"name": content.Schema(type = content.Type.STRING,),"writer": content.Schema(type = content.Type.STRING,),},),),},),"response_mime_type": "application/json",}
model = genai.GenerativeModel(model_name="gemini-1.5-flash",generation_config=generation_config,# safety_settings = Adjust safety settings# See https://ai.google.dev/gemini-api/docs/safety-settingssystem_instruction="Extract the event information.",)
chat_session = model.start_chat(history=[{"role": "user","parts": ["告诉我四大名著分别是什么，以及他们的作者是谁",],},{"role": "model","parts": ["```json\n{\"books\": [{\"name\": \"红楼梦\", \"writer\": \"曹雪芹\"}, {\"name\": \"三国演义\", \"writer\": \"罗贯中\"}, {\"name\": \"水浒传\", \"writer\": \"施耐庵\"}, {\"name\": \"西游记\", \"writer\": \"吴承恩\"}]} \n```",],},])
response = chat_session.send_message("INSERT_INPUT_HERE")
print(response.text)

得到结果：

{"books": [{"name": "红楼梦", "writer": "曹雪芹"}, {"name": "三国演义", "writer": "罗贯中"}, {"name": "水浒传", "writer": "施耐庵"}, {"name": "西游记", "writer": "吴承恩"}]}

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-29

10万元跑满血版DeepSeek，这家公司掀了一体机市场的桌子｜甲子光年

2025-04-29

谷歌大神首次揭秘Gemini预训练秘密：52页PPT干货，推理成本成最重要因素

2025-04-29

一文说清：什么是算法备案、大模型备案、大模型登记 2.0

2025-04-29

MCP：AI时代的“万能插座”，大厂竞逐的焦点

2025-04-29

打起来了！MCP VS A2A，谁才是Agent的未来事实标准？

2025-04-29

Google 的 A2A 与 MCP 该如何选择？还是两种都用？

2025-04-29

一站式AI应用开发平台 Firebase Studio

2025-04-29

精华好文！用LLM评估LLM，真的靠谱吗？技术上如何实现？

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

OpenAI o1与GPT4o的对比分析

2024-09-23

大模型｜“上下文长度”和“上下文窗口”不再傻傻分不清楚！

2024-07-31

一文带你了解大模型——智能体（Agent）

2024-05-28

50+个AI大模型在不同领域的应用案例

2024-08-04

全面对比dify、coze、streamlit、chainlit

2024-04-26

【深度】AI搜索产品深度分析-搜索原理和商业模式分析

2024-07-09

一文读懂OpenAI新发布o1系列大模型

2024-09-17

大家都在问

打起来了！MCP VS A2A，谁才是Agent的未来事实标准？

2025-04-29

Google 的 A2A 与 MCP 该如何选择？还是两种都用？

2025-04-29

精华好文！用LLM评估LLM，真的靠谱吗？技术上如何实现？

2025-04-29

大模型是否有必要本地化部署？

2025-04-28

给 AI 小白的说明书：什么是 Manus？AI Agent为什么重要？

2025-04-28

MCP爆火背后：AI Agent的生产力时代来了吗？

2025-04-28

从MCP到超级Agent：这场AI生产力革命将淘汰谁？

2025-04-28

一文了解：为什么大模型 Agent框架（A2A）采用 JSON-RPC 2.0？

2025-04-28

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB