DlPC 一键懒人包

DlPC 一键懒人包提供 20+ 款本地 AI 工具整合包免费下载，涵盖人像抠图、OCR 文档识别、语音转字幕、数字人、换脸换装等，支持百度网盘与夸克网盘直链，扫码即存，开箱即用。

工具列表（22 款）

Rembg 人像抠图 — Rembg 是一款用于去除图像背景的工具。它可以作为命令行界面 (CLI)、Python 库、HTTP 服务器或 Docker 容器使用。
PaddleOcr PP-StructureV3 文字识别 — PaddleOCR PP-StructureV3 将文档和图像转换为结构化、AI友好的数据（如JSON和Markdown）
SoulX-FlashHead 实时数字人生成器 — SoulX-FlashHead是由Soul AI Lab开发的实时数字人生成系统，能够将音频和图片结合生成流畅的说话人脸视频。
Qwen3TTS 文字转语音 — Qwen3-TTS 是由阿里云 Qwen 团队开发的开源 TTS 模型系列，支持稳定、富有表现力的流式语音生成、自由形式的语音设计和生动的语音克隆。
LatentSync 数字人对口型 — LatentSync 数字人对口型
LTX2.3_T2V 文生视频 — LTX2.3_T2V 文生视频
IOPaint 图片去水印去除背景 — IOPaint 图片去水印去除背景
Wan2.2-Animate 动作迁移流 — Wan2.2-Animate 动作迁移流图片生成视频动作
PaddleOCR-VL-1.5 OCR — PaddleOCR-VL-1.5 是 PaddleOCR-VL 的全新迭代版本能够在扭曲、倾斜、扫描、光照和屏幕拍照的自然文档场景实现精确的版面解析
FireRed-OCR 图片/PDF转MD — 小红书开源 FireRed-OCR 是一个系统化的框架，旨在将通用的大型视觉语言模型 (LVLM) 专门化为高性能、像素级精确的结构化文档解析专家
fashn-vton-1.5 一键换装 — fashn-vton-1.5 一键换装
MatAnyone2 视频去背景 — MatAnyone2 视频去背景
Qwen_ImageEdit_2511 多角度 — Qwen_ImageEdit_2511 多角度
FaceFusionFree4.3-CUDA 换脸 — FaceFusionFree4.3-CUDA 换脸
Flux2-klein-face 换头 — Flux2-klein-face 换头
faster-whisper 语音转字幕 — faster-whisper 语音转字幕
whisperx 语音转字幕 — whisperx 语音转字幕
Qwen3_ASR 语音转字幕 — Qwen3_ASR 语音转字幕
小红书FireRed-Image-Edit 一键提取衣物 — 小红书FireRed-Image-Edit 一键提取衣物
sam3 图像分割 — sam3 图像分割
Qwen3-ASR-Stream-Docker 流式转写 — Qwen3-ASR-Stream-Docker 流式转写
Duix-Avatar开源ai数字人 — Duix-Avatar开源ai数字人