微信扫码
与创始人交个朋友
我要投稿
我很兴奋与大家分享这个非常实用的项目,名为“Local-File-Organizer”。有趣的是,这个项目是开源且免费的,由一位学生开发的,目的是为了整理他或她本地系统上的文件。
这个工具允许你在本地磁盘系统上组织和整理多媒体文件,如文本或图片,还有一些其他支持的格式,稍后我会告诉你。
借助完全私有且本地运行的LLM(大语言模型),你可以整理PNG文件、JPG、JPEG、GIF、BMP格式的图片。对于文本类文件,你可以使用TXT和DOCX格式,此外还能整理PDF文件。
这个工具的工作原理是它利用私有LLM和视觉语言模型的智能来自动整理文件。它会扫描你指定的输入目录(不要给它根目录),然后通过Google的Gemma 2B参数模型进行文本分析,并通过Llava模型进行视觉内容分析。
它能理解文件的内容(无论是文本、图片等),然后生成相关的描述、文件夹名称和文件名称,最后基于生成的元数据重新组织文件到一个新的目录结构中。
所有操作都在本地进行,因为它使用了Nexa SDK。
此外,你可以完全离线使用这个“本地文件管理器”,不需要任何AI API之类的东西,一切都是私密的、本地的和安全的。
让我们开始吧!在展示安装步骤之前,
我将克隆这个“本地文件管理器”的代码仓库,它非常轻量。
克隆完成后,我进入这个目录,然后创建一个虚拟环境,这也是推荐的操作。你不仅可以在Linux上执行这些命令,还可以在Windows和macOS上完成相同的操作。
等待虚拟环境创建完成后,确保你正在使用Python 3.12版本,虚拟环境创建完成后,我们激活它。
下一步,我们需要安装Nexa。由于我使用的是Nvidia的GPU,所以我将使用Cuda运行这些命令来安装Nexa,
你可以在GitHub仓库中找到这些命令。
安装过程可能需要一些时间,所以我们等待它完成。Nexa和Nexa SDK安装完成后。
接下来,从这个代码仓库的根目录安装所有依赖。
有时这些依赖会安装失败,如果发生这种情况,只需打开requirements.txt文件并不带版本号地运行它。不过在这个案例中,一切都成功了。
接着我在本地系统上创建了一个新目录,放入了一张图片、一个PDF文件和一个文本文件,它们都包含一些随机信息。然后我将用这些文件测试这个“本地文件管理器”。
现在,要运行它,你只需要运行Python main.py命令,这将启动“本地文件管理器”。运行后,它会询问你要整理哪个目录,确保不要给它根目录,我希望开发者未来能加入一种预运行模式。
现在我选择了这个目录,并指定了一个输出目录。如果不想指定,可以直接按回车键,它会在输入目录下生成一个名为“Organized”的新文件夹。我决定为输出目录指定一个新的路径。
现在工具开始运行了,第一次运行时需要下载一些模型,包括Llava和Gemma 2模型。我们需要等待一会儿。
当它完成时,你可以看到它首先处理的是一张大教堂的图片,并告诉你这个图片的具体信息。
接着是PDF文件,最后是一个只有一句话的文本文件。
所有文件都被保存到了我的指定目录中,比如这张大教堂的图片被命名为“Vian Gothic Cathedral.png”,PDF文件被命名为“Hello there subscribe.txt”,而文本文件由于信息较少,被命名为“Untitled Media”。
让我从图形界面展示一下,打开“De letter”文件夹,工具把大教堂图片组织到了一个名为“Cathedral”的文件夹中,并重命名为“Vian Gothic Cathedral”。文本文件被组织到了“Communication”文件夹中,并重命名为“Hello there subscribe.txt”。
至于科技类文件,它被放到了“Technology”文件夹中,不过由于文件内容比较少,它只简单地命名为“Technology”,这部分可能做得不是很完美。
总的来说,这个工具非常不错,它并没有改变原始文件夹,这一点非常好。
如果你想尝试在根目录下运行,我建议开发者引入预运行模式或保护机制,因为Linux系统没有警告提示。如果在Linux上以root用户运行,系统不会阻止你,因此要格外小心。
总的来说,这是一个不错的项目,对于本地化PC操作智能具有贡献意义
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-12-30
比扣子简单! Cline+MCP 快速打造Agent工作流: 实战案例解析
2024-12-28
突发!刚刚,OpenAI裂变成了两块:一块营利,一块非营利
2024-12-27
DeepSeek-V3最新开源,第一手评测解读速递
2024-12-27
阿里巴巴推出可与 OpenAI o1 相媲美的人工智能,而且是开源的!
2024-12-27
2024 年最喜欢的产品、模型和技术博客:Cursor、Claude3.5-Sonnet 和 Jina
2024-12-26
DeepSeek-V3 正式发布
2024-12-26
2024年大模型后训练(post-training)总结
2024-12-26
突破与超越:CosyVoice 2.0—— 阿里巴巴通义实验室的语音进阶新作
2024-05-06
2024-07-25
2024-08-13
2024-06-12
2024-07-11
2024-07-20
2024-06-16
2024-09-20
2024-06-15
2024-06-06
2024-12-24
2024-12-20
2024-12-19
2024-11-22
2024-11-19
2024-11-13
2024-11-13
2024-10-07