我要投稿

利用开源Ollama快速熟悉LLM设计方法（4. computional graph）

发布日期：2024-04-23 06:30:04 浏览次数： 2291

作者：数据分析与AI技术

微信搜一搜，关注“数据分析与AI技术”

有了输入数据，接下来就来了解数据的计算过程，深度学习的数据计算都是以张量（tensor）为计算单元进行各种计算，而把张量和计算过程组织起来需要用到计算图（computional graph），通过建立计算图可以实现几乎所有的深度学习数据计算，当然，LLM也不例外。

Ollama工程中的“ggml.c/h“模块实现了张量数据结构定义，张量计算，计算图生成和处理，首先来了解张量数据结构定义：

从上图中可以看出，这是一个包含了张量操作的张量数据结构定义，详细解释如下：type，表示张量的数据类型，如浮点数、整数等；backend，表示张量所使用的后端类型，如CPU、GPU等；buffer，与后端相关的缓冲区信息；ne，表示张量在每个维度上的长度；nb，表示张量在每个维度上的字节数，用于计算张量计算所需的内存；op，表示与张量相关的操作类型，如加法、乘法等；op_params，用于存储与操作相关的参数；flags，用于存储张量的特定标志，如是否需要梯度计算等；grad，表示张量的梯度，用于自动微分计算；src，表示生成当前张量的源张量，即张量计算所需要的张量；perf_runs，表示性能测试的运行次数；perf_cycles，表示性能测试中的周期数；perf_time_us，表示性能测试的时间，单位为微秒；view_src，表示当前张量是另一个张量的视图；view_offs，表示视图在源张量中的偏移量；data，指向张量的实际数据；name，张量的名称；extra，用于存储额外的信息，如特定于后端的数据；padding， 8字节填充，用于内存对齐。

ggml定义了一套内存管理机制来存储张量数据，所有的张量在统一的内存中进行存储：

ggml.h的注释中说明了如何利用计算图来实现下面函数计算的过程：

f(x) = a*x^2 + b

第一步：分配张量处理所需的内存：

struct ggml_context * ctx = ggml_init(params);

第二步：建立x、a、b三个张量，其中设置x为参变量：

struct ggml_tensor * x = ggml_new_tensor_1d(ctx, GGML_TYPE_F32, 1);

ggml_set_param(ctx, x); // x is an input variable

struct ggml_tensor * a= ggml_new_tensor_1d(ctx, GGML_TYPE_F32, 1);

struct ggml_tensor * b= ggml_new_tensor_1d(ctx, GGML_TYPE_F32, 1);

第三步：定义两个分别带乘法和加法的两个张量：

struct ggml_tensor * x2 = ggml_mul(ctx, x, x);

struct ggml_tensor * f= ggml_add(ctx, ggml_mul(ctx, a, x2), b);

这样便形成了一个张量计算图：

从上图可以看出张量f嵌套了计算所需的张量和计算方法。

第四步：后序遍历上图中的计算图，得到张量计算图：

struct ggml_cgraph * gf = ggml_new_graph(ctx);

ggml_build_forward_expand(gf, f);

生成的计算图数据存储到如下数据结构中：

从计算图的数据结构中容易发现张量被分成叶子节点张量（leafs）和带操作符的非叶子节点张量(nodes)，两种张量被分别存储，由于是后序遍历，nodes存的张量是按计算顺序存储的带操作方法的张量，即只要按顺序遍历nodes即可实现所需函数计算过程。

第五步：设置好叶子张量的数据后即可执行张量计算：

ggml_set_f32(x, 2.0f);

ggml_set_f32(a, 3.0f);

ggml_set_f32(b, 4.0f);

ggml_graph_compute_with_ctx(ctx, &gf, n_threads);

为此，我们了解了计算图的基本使用方法，为后续的LLM代码实现方法的理解扫除了障碍。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2024-07-10

科研助力神器：Scholar GPT，百倍提升你的研究效率！

2024-07-09

Doc2X：一款功能超级强大的文档解析与转换工具

2024-07-06

我对多智能体协作过程自动演化架构设计

2024-07-06

可穿戴AI，底层逻辑的变化

2024-07-06

一文彻底搞懂Transformer - Word Embedding（词嵌入）

2024-07-06

AI动态 | 腾讯元宝AI搜索能力升级：深度搜索模式上线

2024-07-06

智能手表 + AI ，都已经这么智能了？？

2024-07-06

死磕10万卡GPU算力集群，腾讯星脉网络2.0有什么秘密武器？

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

看大厂PM，如何玩转多个智能体开发平台

2025-06-17

53AI Hub重磅开源！让99%的智能体开发者赚到钱！

2025-06-17

DeepSeek R1-0528 小版本升级

2025-05-29

源神降临！阿里 Qwen3 全系发布，免费商用，消费级显卡就能跑！(深度解读 + 实战case)

2025-04-29

高效 Agents 构建指南

2025-05-23

分而治之：全面解析分布式分离 Inference 系统

2025-04-29

忽视小模型和知识库，企业AI应用必将是死路一条

2025-05-07

Qwen3发布: 4B干掉旧代 72B / Windsurf又增加新的免费计划

2025-04-29

CAG 与 RAG：哪种方法能带来性能更好的人工智能

2025-05-07

从RAG到CoT再到MCP，一文读懂AI Agent落地难题｜大模型研究

2025-05-07

大家都在问

Context Engineering（上下文工程）是 AI Agent 成功的关键吗？

2025-07-15

当AI开始“组团上班”：大模型多智能体协作到底有多牛？

2025-07-15

大模型检索“内卷”时代，BGE凭什么成为终极答案？

2025-07-15

月费200刀的AI浏览器，Perplexity Comet的真实体验如何？

2025-07-14

智能体Agent这场风暴还能刮多久？

2025-07-14

从机器人三定律说起：当AI遇上道德难题，我们该如何选择？

2025-07-14

初次上手如何快速开发基于大模型+function call的agent应用？

2025-07-14

如何搭建Agent的知识库底座？

2025-07-14

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

友情链接：

CopyRight © 2012-2024 深圳市博思协创网络科技有限公司版权所有

粤ICP备17114055号

广州：广州市华景路37号(华景软件园)暨南大学科技大厦6楼（整层）

深圳：深圳市福田区泰然四路29号天安创新科技广场一期A座1204

上海：上海市浦东新区金新路58号1602室

微信扫码
和创始人交个朋友

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部