我要投稿

一句话生成整个网站，WebDesignAgent颠覆网页设计！

发布日期：2024-07-07 07:51:26 浏览次数： 3096 作者：原子社

Hello，大家好！今天我要向大家介绍一个令人兴奋的新项目 - WebDesignAgent。作为一个热爱科技创新的博主，我一直在关注能够简化我们日常工作的人工智能工具，而WebDesignAgent是其中一个最为革命性的，这款AI工具和以往的网页生成工具不太一样。

有哪里不一样？请听我娓娓道来。

想象一下，只需要一段文字描述或几张图片，就能生成一个功能齐全、设计精美的网站，这是不是听起来很不可思议？WebDesignAgent就是这样一个神奇的工具。可以把它定义为一个智能体（Agent），能够帮助我们轻松创建各种类型的网站。

WebDesignAgent的核心优势在于它的多样化输入方式。

? 主要特性

多种输入方式：

文字描述？没问题！

图片灵感？当然可以！

视觉布局参考？轻松搞定！
或者，来个混合输入怎么样？

智能多页面设计：不仅仅是一个单页面，WebDesignAgent可以为你创建一个完整的、相互关联的多页面网站。
用户友好的定制：喜欢亲自动手？你可以轻松地添加、删除或修改网页内容。
视觉智能：借助强大的多模态大模型（目前支持ChatGPT-4o），它能自主优化网页布局。

? 实际案例

基于简单描述创建的购物网站

2. 利用单张图片生成的阿里巴巴达摩院网站

这些例子展示了WebDesignAgent的强大功能和灵活性。无论你是想创建一个简单的个人博客，还是复杂的电商平台，它都能满足你的需求。

但WebDesignAgent的强大之处不仅仅在于页面设计。它支持多页面设计，能够生成相互关联的网页。你可以根据需要添加、删除或修改网页内容。最令我印象深刻的是它的迭代优化功能 - 你可以提供反馈，它就能据此精确修改网站代码。这种人机协作的方式，让网站设计变得更加精准和个性化。

✨主要技术组件：

从技术层面来看，这个项目目前是基于OpenAI的API来实现生成的。其中包括GPT-4系列模型，这使得该智能体能够理解我们的自然语言指令，并生成相对应的HTML、CSS和JavaScript代码。至于图片是使用了DALL-E 3生成的，结合了GPT4的文本能力，实现了文本到图像的能力。且使用了特定的提示工程（prompt engineering）技术来优化代码生成的质量和一致性。最后是GPT-4o多模态视觉理解能力，能够基于图片或视觉线索生成网站。

好了，接下来我们就开始实际上手吧！

如何安装

一、项目拉取

我们进入WebDesignAgentGitHub页面拉取该项目，可以分为命令拉取或者下载压缩包（按照实际情况二选一）。

1. 命令拉取：以Windows为例，我们用CMD命令打开终端或打开Power shell，在终端内输入以下命令开始拉取该项目。

git clone https://github.com/DAMO-NLP-SG/WebDesignAgent.git

2. 下载压缩包：如果没有安装过git clone，我们下载该项目的压缩包，解压后开始安装。

接下来，开始拉取该项目所需依赖，我们进入项目的文件夹，在该文件夹内打开终端。

输入以下命令拉取依赖

pip install -r requirements.txt

由于我已经拉取过了，所以会这样显示，拉取完之后终端窗口不要关闭，接下去会用到。

Tips：这里有个坑，如果依赖没有完全拉取成功，OpenAI接口返回了代码之后无法生成页面，但是调用接口的费用会扣除。

二、变量配置

用VScode或NotePad++打开config.yaml文件，如果没有安装过VScode或NotePad也可以用记事本打开。

这里需要配置API KEY，有两种选择（二选一）：

AZURE_OPENAI：这里需要有微软的AzureKey，如果没有的话，需要改is_azure：False具体如何获取就不介绍了。
OPENAI_API_KEY：必填，这里填入OpenAI官方的APIkey（也可以填入中转的key）。
OPENAI_PROXY_URL ：非必填，有中转需要在这里填入中转地址。