DragGAN AI:如何安装和使用图像编辑器

fffmCQ.jpg

DragGAN AI 代表了人工智能图像编辑器发展的新领域。它具有像使用烤面包机一样直观的拖放界面,为照片编辑带来了令人耳目一新的方法。也就是说,虽然 DragGAN 一旦正确设置就很容易使用,但初始设置过程确实需要一定水平的技术熟练程度。这正是本详细指南所解释的内容。我们将深入探索 DragGAN 的丰富潜力,并逐步指导您安装和使用图像编辑器。

在本指南中:

  • 什么是 DragGAN 人工智能?
    • 如何安装DraGAN AI
    • DragGAN的安装过程是怎样的?
      • 如何使用 DragGAN AI?
      • DragGAN AI 的价格是多少?
      • DragGAN AI 的价值在于其潜力
      • 经常问的问题

      什么是 DragGAN 人工智能?

      DragGAN 是一款AI 图像编辑器,用于编辑 GAN 生成的图像。简而言之,它允许用户将图像中的内容从 A 点“拖动”到 B 点,就像在计算机桌面上移动图标一样。

      您单击几个点(我们称它们为“处理点”,因为您可以处理它们)。您将它们拖到您想要的位置(“目标点”)。瞧!图像发生变形,就像被魔杖击中一样。想要在玩毕加索的同时保持图像的某些部分固定吗?只需突出显示您想要保留的区域,DragGAN 就会尊重您的艺术界限。

      当然,DragGAN 与其他AI 图像生成器一样,进入了机器学习和神经网络的大脑世界。然而,它与其他流行的AI 工具(例如DALL-E 2.0Stable Diffusion)有本质的不同。让我们快速浏览一下这些差异,以便更好地理解 DragGAN。

      DragGAN 与其他 AI 图像编辑器有何不同?

      DragGAN 基于 GAN(生成对抗网络),而 Midjourney、DALL-E 2.0、 Midjourney 、Stable DiffusionETC则基于扩散模型。

      GAN 和扩散模型都是生成模型,旨在生成与其训练数据相似的新数据。尽管有这个共同的目标,但他们的生成建模方法却有很大不同。

      GAN 通过两个神经网络(生成器和鉴别器)之间的动态竞争来运行。生成器的任务是生成新数据,而鉴别器的作用是区分真实的有机数据和生成器生成的数据。当它们同时接受训练时,生成器的目的是欺骗鉴别器接受其创建的数据是真实的,而鉴别器则磨练其检测这些模仿的技能。

      相反,扩散模型采用独特的方法。从颗粒状图像开始,他们有条不紊地完善和增强它,直到它反映出栩栩如生的画面。这种增强技术被称为“扩散”,本质上与压缩图像的概念相反。为了确保输出尽可能接近原始图像,扩散模型经过训练以减少生成图像和真实图像之间的差异,利用特定的损失函数来量化它们的差异。

      因此,本质上,GAN 和扩散模型就像两位具有不同专长的艺术家。 GAN 擅长创建更真实的图像。然而,它们可能会占用大量资源,对计算机的处理能力要求很高。另一方面,扩散模型在生成独特的、创造性的视觉效果方面表现出色。它们可能并不总是以照片写实为目标,但它们带来了新鲜的视角,同时对您的系统更加温和。

      GAN 与扩散模型

      甘 VS 扩散 GAN 与扩散模型: BeInCrypto

      快速浏览一下引擎盖下的情况

      DragGAN由马克斯普朗克研究所的一组研究人员开发。 DragGAN 的开发是由一个明确的需求驱动的:虽然 GAN 擅长生成逼真的图像,但调整这些图像的特定部分通常非常具有挑战性。许多现有的方法通常依赖于 3D 模型或监督学习,就像尝试用大画笔绘画一样——它们缺乏不同图像类别所需的技巧和适应性。

      这就是 DragGAN 独特方法旨在发挥作用的地方。它使用所谓的交互式基于点的操作。例如,如果您的猫在照片中的姿势看起来不对,您可以轻松调整它。对毕业照中闷闷不乐的表情不满意?不用担心,只需进行一些简单的拖动和调整,您就可以将您的表情转变为一个兴高采烈、有成就的毕业生的表情。这种方法提供了对各种空间属性的控制,并且不偏袒——它在不同的对象类别中具有通用性。

      在技​​术方面,DragGAN 在 GAN 的特征空间中运行。它使用一种称为移位特征补丁丢失的方法来微调图像的潜在代码,确保这些处理点平滑地滑向其目标目的地。 DragGAN 在从狮子、汽车到风景等一系列数据集的试运行中证明了其价值。

      从本质上讲,DragGAN 正在为图像编辑树立新的黄金标准。它的目标是融合精确性、灵活性和广泛的适用性,从而成为合成和真实图像编辑的潜在游戏规则改变者。

      我们的方法利用预先训练的 GAN 来合成图像,这些图像不仅精确地遵循用户输入,而且还保留在多种真实图像上。与许多以前的方法相比,我们提出了一个通用框架,不依赖于特定领域的建模或辅助网络。

      这是通过使用两种新颖的成分来实现的:潜在代码的优化,将多个手柄点逐步移向其目标位置,以及点跟踪程序,以忠实地跟踪手柄点的轨迹。

      – DragGAN研究论文

      如何安装DraGAN AI

      DragGAN 在以下系统配置下效果最佳:

      • 操作系统:Linux和Windows都可以,但首选Linux,因为它具有更好的性能和兼容性。
      • GPU:1-8 个高端 NVIDIA GPU(至少 12 GB 内存)。
      • Python 和库:
      • CUDA:工具包 11.1 或更高版本。
      • 编译器:
        • Linux:GCC 7 或更高版本。
        • Windows:视觉工作室。
      • 对于 Docker 用户:安装 NVIDIA 容器运行时。

      您可以使用 Anaconda(或 Miniconda3)为 DragGAN 创建虚拟环境。

      DragGAN的安装过程是怎样的?

      第 1 步:下载并安装 Python

      • 访问Python官方网站: python.org
      • 导航至“下载”。
      • 选择正确的 Python 版本。对于 DragGAN,您需要 Python 3.8 或更高版本。
      • 单击下载链接。
      • 导航到下载文件夹中下载的可执行文件,双击它,然后按照屏幕上的说明进行操作。

      要仔细检查您是否安装了正确的版本,

      • 启动“开始”菜单并搜索“命令提示符”(CMD)。
      • 终端启动后,输入“python –version”并按 Enter 键。

      当前安装的Python版本将显示如下图所示。

      拖动GAN安装

      步骤#2:下载 Anaconda

      • 访问 Anaconda:在浏览器中搜索“Anaconda”,转到官方网站,然后前往“定价”部分找到“免费版本”。
      • 下载:在下载页面上,选择 64 位操作系统(Windows 或 MAC)的发行版,然后点击“下载”。
      • 开始安装:找到下载的文件,双击启动,然后按照安装向导操作,接受许可协议。
      • 安装首选项:为个人使用选择“Just Me”,为系统上的每个人选择“All Users”。坚持默认安装路径。
      • 总结:安装后,根据需要调整设置(可能不需要),然后单击“完成”完成该过程。

      蟒蛇

      步骤#3 安装 DragGAN AI

      设置 DragGAN 框架:

      • 导航到 DragGAN 的官方GitHub 存储库
      • 使用绿色“代码”按钮捕获存储库的链接。

      安装dragGAN AI

      • 启动终端或命令提示符,然后前往您选择的文件夹。
      • 使用此命令进行克隆:git clone [copied_link]。确保将 [copied_link] 替换为实际 URL,即 github.com/XingangPan/DragGAN.git。
      • 使用以下命令切换到 DragGAN 文件夹:cd DragGAN。

      命令提示符准备 Conda 设置:

      在命令提示符终端中,使用以下命令通过给定的environment.yml 文件启动环境:

      conda env create -f 环境.yml康达

      现在,使用以下命令激活 Conda 环境:

      conda 激活 stylegan3

      请注意,如果您在此处遇到错误,请尝试运行旧的激活命令:

      激活stylegan3 较旧的激活

      如果所有步骤均已正确执行并且 conda 环境现已激活,您的终端应显示:

      (stylegan3) C:/Users/user/DragGAN>获取必要的依赖项:

      要获取必要的库,请执行:

      pip install -r 要求.txt

      如果您已经像我们一样在环境中安装了大部分软件包,终端将显示以下消息:“要求已满足。”您尚未安装的任何软件包都会自动安装。

      代码 设置 MPS Fallback(Windows 用户不需要):

      要利用 Metal Performance Shaders (MPS) 库并在必要时切换到 CPU,请运行:

      导出 PYTORCH_ENABLE_MPS_FALLBACK=1

      获取预先配置的模型:

      使用以下命令获取预先配置的模型:

      python 脚本/download_model.py python脚本安装draggan ai运行 DragGAN GUI 工具:

      使用以下命令启动 DragGAN AI GUI:

      python Visualizer_drag_gradio.py

      如果您在这里遇到任何错误,请尝试卸载“torch”库,然后重新安装。

      您可以使用以下命令卸载并重新安装 torch:

      pip 卸载 torchpip 安装 torch

      如果所有步骤均已正确执行并且 DragGAN 图形用户界面已准备好启动,您将在终端中收到一条确认消息,内容如下:

      在本地 URL 上运行:http://127.0.0.1:7860

      在公共 URL 上运行:https://a8aeb5c99e1ecdde7c.gradio.live

      您可以通过将两个 URL 中的任意一个复制粘贴到您最喜欢的 Web 浏览器上来调用 DragGAN AI GUI。

      DragGAN 人工智能 GUI

      如何使用 DragGAN AI?

      无论您是要精彩的自拍照、宠物的坦诚时刻、风景优美的度假胜地,还是拍摄甜蜜的骑行照片,DragGAN 都能满足您的需求。

      因此,以下是使用 DragGAN 的方法:

      • 打开浏览器,点击本地 URL,就这样!欢迎来到 DragGAN 界面。
      • 发现左上角了吗?选择与您照片中的明星(小狗、种马、您的好友玛吉,凡是您能想到的)相呼应的合适模特。
      • 接下来,点击该图像。精确定位几个点(使用“添加点”选项)。你想变得充满艺术气息吗?添加更多点以获得额外的风格。
      • 密谋完成了吗?点击“开始”按钮,让魔法开始。
      • 当 DragGAN 发挥其魅力时,您的终端会闲聊,泄露有关改造阶段的详细信息。
      • 小心!如果计数器在达到 100 后变得安静,请轻轻推动它(手动停止)。
      • 一旦你的杰作准备好了,右上角就会有一个下载按钮。单击它,然后保存编辑后的图片。
      • 如果您渴望尝试新造型或想搞砸,别有压力! “重置点”为您提供支持。

      请记住,DragGAN 仍在开发中,每天都在学习新技巧。其背后的团队不断调整和调整该工具以引入新的特性和功能。

      DragGAN AI 的价格是多少?

      截至 2023 年 8 月中旬,DragGAN AI 正处于开发的早期阶段。它背后的团队已在 GitHub 上免费提供它。如果你想探索它的功能,可以从该项目的官方GitHub 页面下载。该团队尚未透露有关未来潜在定价或货币化策略的任何信息。

      DragGAN AI 的价值在于其潜力

      长话短说,DragGAN AI 功能和用例具有潜力。它的功能可以通过改变我们与图像交互和操作的方式来彻底改变摄影、图像编辑和相关行业。也就是说,它的能力在当前的化身中被夸大了。许多人忽视了这样一个事实:您不能仅仅使用它来编辑和操作您想要的任何图像。例如,要编辑手机图库中的图像,您首先需要使用专门的工具对图片进行 GAN 反转。对于外行来说,GAN 反转是将真实图像映射回 GAN 潜在空间的过程。

      另外,不要忘记,虽然 DragGAN AI 的功能令人印象深刻,但它需要强大的计算能力。您需要高端 GPU 设置才能在计算机上本地顺利运行。与任何处于早期阶段的工具一样,都有成长和完善的空间。当与其他 AI 工具并列时,DragGAN 致力于使图像交互更加自然,这一点显而易见,这使其与其他流行的 AI 图像编辑器区分开来。

      经常问的问题

      如何访问 DragGAN AI?

      您可以访问该项目的官方 GitHub 页面来访问 DragGAN AI,并按照上述详细步骤进行下载。请务必首先检查系统要求,因为 DragGAN 是一个资源密集型工具,需要高端 GPU 才能顺利运行。

      DragGAN AI 是免费的吗?

      截至 2023 年 8 月中旬,DragGAN AI 正处于开发的早期阶段。它背后的团队已在 GitHub 上免费提供它。如果您热衷于探索其功能,可以从该项目的官方 GitHub 页面下载。

      使用 DragGAN AI 时图像的大小有哪些限制?

      DragGAN AI 的效率可能会根据所使用图像的复杂性和尺寸而波动。最好从更紧凑的图像开始,逐渐扩展到更大的图像。

      声明:该文观点仅代表作者本人,与炒币网无关。炒币网系信息发布平台,仅提供信息存储空间服务。对所包含内容的准确性、可靠性或者完整性不提供任何明示或暗示的保证,并不对文章观点负责。 提示:投资有风险,入市须谨慎。本资讯仅供参阅,不作为投资理财建议。

      发表评论

      登录后才能评论