我要投稿

AI数据分析：用kimi批量根据word文档生成词云图片

发布日期：2024-06-02 14:46:38 浏览次数： 2586 作者：Dance with GenAI

在kimi中输入提示词：

你是一个Python编程专家，完成如下Python脚本的编写：

读取"F:\AI.docx"这个文件；

然后用jieba分词对文件内容进行分词；

用wordcloud生成词云，背景颜色设为白色；

词云图片保存到F盘；

注意：每一步都要输出相关信息到屏幕上

指定使用Windows系统中的黑体字体，字体路径为：'C:\\Windows\\Fonts\\simsun.ttc'

为什么要指定字体呢？

如果不指定字体，词云中的英文显示正常，但是中文是乱码的。生成词云时中文显示为乱码通常是因为字体问题。wordcloud库默认使用的字体可能不支持中文字符，因此需要指定一个支持中文的字体。在Python中，一个常用的支持中文的字体是'SimHei'（黑体）。要解决这个问题，需要做两件事：指定中文字体：在创建WordCloud对象时，设置font_path参数为一个支持中文的字体路径。安装中文字体：如果你的系统中没有安装支持中文的字体，你需要先安装一个。

Kim生成的Python源代码:

import os

from docx import Document

from wordcloud import WordCloud

import jieba

from PIL import Image

import numpy as np

# 设置文件路径和字体路径

docx_path = 'F:\\AI.docx'

output_image_path = 'F:\\wordcloud.png'

font_path = 'C:\\Windows\\Fonts\\simsun.ttc' # 指定Windows系统中的黑体字体路径

# 检查文件是否存在

if not os.path.isfile(docx_path):

print(f'文件 {docx_path} 不存在。')

else:

# 读取Word文档

doc = Document(docx_path)

text = " ".join([para.text for para in doc.paragraphs])

print('文件读取成功。')

# 使用jieba进行中文分词

words = " ".join(jieba.cut(text, cut_all=False))

print('分词完成。')

# 生成词云

wordcloud = WordCloud(

font_path=font_path, # 指定中文字体路径

background_color='white',

max_words=200,

max_font_size=100,

random_state=42,

width=800,

height=400,

colormap='viridis'

).generate(words)

# 保存词云图片

wordcloud.to_file(output_image_path)

print(f'词云图片已保存到 {output_image_path}')

# 显示词云图片

image = Image.open(output_image_path)

image.show()

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-06-01

SpringAI Alibaba实战文生图、聊天记忆功能

2025-06-01

企业AI Agent落地路径及关键动作详解

2025-06-01

互联网女皇玛丽·米克尔刚发布了一份340页的《人工智能趋势报告》，这里总结了10个核心观点

2025-06-01

从AI Agent看企业智能化服务---OA篇

2025-05-31

AI智能体常用五大范式：反思、工具、推理、规划与多智能体协作

2025-05-31

MCP、A2A 后，AI 领域又新增 AG-UI 协议

2025-05-31

Cursor 0.51.1: 小版本，大更新！

2025-05-31

一文搞懂大模型知识增强：知识注入（Prompt + Finetune + RAG）

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

大模型｜“上下文长度”和“上下文窗口”不再傻傻分不清楚！

2024-07-31

OpenAI o1与GPT4o的对比分析

2024-09-23

一文带你了解大模型——智能体（Agent）

2024-05-28

50+个AI大模型在不同领域的应用案例

2024-08-04

全面对比dify、coze、streamlit、chainlit

2024-04-26

【深度】AI搜索产品深度分析-搜索原理和商业模式分析

2024-07-09

3万字讲解大模型高效推理｜清华综述

2024-07-20

大家都在问

谷歌搜索“AI模式”来了，Perplexity慌不慌？

2025-05-31

Agent “兴” ，企业软件 “亡” ？

2025-05-29

AI界的“八仙过海”：八大专业模型各显神通，谁才是你的“菜”？

2025-05-29

Agent如何突破大模型的想象力？

2025-05-29

具身智能需要从ImageNet做起吗？

2025-05-28

AI Agent大爆发：谁能成为你的首选“超级助手”？

2025-05-28

AI时代下的软件升级：大模型如何让考勤系统听懂人话？

2025-05-27

AI搜索+DeepResearch=？

2025-05-26

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

友情链接：

CopyRight © 2012-2024 深圳市博思协创网络科技有限公司版权所有

粤ICP备17114055号

广州：广州市华景路37号(华景软件园)暨南大学科技大厦6楼（整层）

深圳：深圳市福田区泰然四路29号天安创新科技广场一期A座1204

上海：上海市浦东新区金新路58号1602室

微信扫码
和创始人交个朋友

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部