我要投稿

AI数据分析：用kimi批量根据word文档生成词云图片

发布日期：2024-06-02 14:46:38 浏览次数： 3303

作者：Dance with GenAI

微信搜一搜，关注“Dance with GenAI”

在kimi中输入提示词：

你是一个Python编程专家，完成如下Python脚本的编写：

读取"F:\AI.docx"这个文件；

然后用jieba分词对文件内容进行分词；

用wordcloud生成词云，背景颜色设为白色；

词云图片保存到F盘；

注意：每一步都要输出相关信息到屏幕上

指定使用Windows系统中的黑体字体，字体路径为：'C:\\Windows\\Fonts\\simsun.ttc'

为什么要指定字体呢？

如果不指定字体，词云中的英文显示正常，但是中文是乱码的。生成词云时中文显示为乱码通常是因为字体问题。wordcloud库默认使用的字体可能不支持中文字符，因此需要指定一个支持中文的字体。在Python中，一个常用的支持中文的字体是'SimHei'（黑体）。要解决这个问题，需要做两件事：指定中文字体：在创建WordCloud对象时，设置font_path参数为一个支持中文的字体路径。安装中文字体：如果你的系统中没有安装支持中文的字体，你需要先安装一个。

Kim生成的Python源代码:

import os

from docx import Document

from wordcloud import WordCloud

import jieba

from PIL import Image

import numpy as np

# 设置文件路径和字体路径

docx_path = 'F:\\AI.docx'

output_image_path = 'F:\\wordcloud.png'

font_path = 'C:\\Windows\\Fonts\\simsun.ttc' # 指定Windows系统中的黑体字体路径

# 检查文件是否存在

if not os.path.isfile(docx_path):

print(f'文件 {docx_path} 不存在。')

else:

# 读取Word文档

doc = Document(docx_path)

text = " ".join([para.text for para in doc.paragraphs])

print('文件读取成功。')

# 使用jieba进行中文分词

words = " ".join(jieba.cut(text, cut_all=False))

print('分词完成。')

# 生成词云

wordcloud = WordCloud(

font_path=font_path, # 指定中文字体路径

background_color='white',

max_words=200,

max_font_size=100,

random_state=42,

width=800,

height=400,

colormap='viridis'

).generate(words)

# 保存词云图片

wordcloud.to_file(output_image_path)

print(f'词云图片已保存到 {output_image_path}')

# 显示词云图片

image = Image.open(output_image_path)

image.show()

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-05-08

Codex Chrome 插件实测：多标签并行后，AI 浏览器代理终于顺手了

2026-05-08

AI吞噬软件的叙事要分化了？

2026-05-08

民生银行基于规格驱动开发（SDD）的 CodeAgent 私域研发探索与实践

2026-05-08

Agent 时代的生产力悖论：当协作本身成为最大的瓶颈

2026-05-08

OpenAI发布新一代实时语音模型，能够像人说话一样进行推理、翻译和转录

2026-05-07

用Agent评测思路管理AI Coding —— 31万行代码AI重构的实践

2026-05-07

Anthropic 官方生产级 Agent 最佳实践：12 个可复用的 MCP 设计模式

2026-05-07

从“记住”到“学会”：OceanBase seekdb M0 如何让 Agent 真正积累经验

联系获取

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Claude Opus 4.7刚刚曝光！Claude Code一夜重构，7x24小时替你打工

2026-04-15

刚刚Qwen 3.6 Plus上线预览：1M上下文，阿里Coding/Agent翻身战打响

2026-03-31

2026年国内如何注册 Claude 账号教程

2026-03-13

豆包 2.0 模型发布，全信息整理（全网最完整，另附 79 页 Model Card）

2026-02-14

OpenAI Codex CLI 完整使用指南

2026-04-07

独家| DeepSeek-V4终于要来了：梁文锋憋半年大招，多模态+长期记忆全面破局

2026-03-17

全网最详细的Codex入门教程，手把手教你玩转Vibe Coding。

2026-02-09

香港终于能直接用 Gemini 了，内地用户能用上吗？

2026-03-17

编程选GPT-5.4，还是GPT-5.3-Codex？

2026-03-21

全球首个 AI 进化网络 EvoMap，给 Agent 装上 DNA

2026-02-20

大家都在问

AI吞噬软件的叙事要分化了？

2026-05-08

为什么同一个模型，在 Claude Code/Codex CLI 里感觉像换了个脑子？

2026-05-07

「双线实测」Qwen 3.6-Plus，Agentic Coding 已经这么能「扛活儿」了？

2026-04-26

本体化语义层，会是 AI 数据平台的新地基吗？

2026-04-22

设计行业的“棺材板”，要被Claude Design盖上了？

2026-04-18

当所有人都不写代码了，谁来看懂代码？

2026-04-13

什么场景该用 AI Native？

2026-04-12

12MB的Go二进制，让AI操控浏览器只花800 tokens，PinchTab凭什么这么省？

2026-04-07

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB Palantir Glean Openclaw

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部