DlPC 一键懒人包
DlPC 一键懒人包提供 20+ 款本地 AI 工具整合包免费下载,涵盖人像抠图、OCR 文档识别、语音转字幕、数字人、换脸换装等,支持百度网盘与夸克网盘直链,扫码即存,开箱即用。
工具列表(22 款)
- Rembg 人像抠图 — Rembg 是一款用于去除图像背景的工具。它可以作为命令行界面 (CLI)、Python 库、HTTP 服务器或 Docker 容器使用。
- PaddleOcr PP-StructureV3 文字识别 — PaddleOCR PP-StructureV3 将文档和图像转换为结构化、AI友好的数据(如JSON和Markdown)
- SoulX-FlashHead 实时数字人生成器 — SoulX-FlashHead是由Soul AI Lab开发的实时数字人生成系统,能够将音频和图片结合生成流畅的说话人脸视频。
- Qwen3TTS 文字转语音 — Qwen3-TTS 是由阿里云 Qwen 团队开发的开源 TTS 模型系列,支持稳定、富有表现力的流式语音生成、自由形式的语音设计和生动的语音克隆。
- LatentSync 数字人对口型 — LatentSync 数字人对口型
- LTX2.3_T2V 文生视频 — LTX2.3_T2V 文生视频
- IOPaint 图片去水印 去除背景 — IOPaint 图片去水印 去除背景
- Wan2.2-Animate 动作迁移流 — Wan2.2-Animate 动作迁移流 图片生成视频动作
- PaddleOCR-VL-1.5 OCR — PaddleOCR-VL-1.5 是 PaddleOCR-VL 的全新迭代版本 能够在扭曲、倾斜、扫描、光照和屏幕拍照的自然文档场景实现精确的版面解析
- FireRed-OCR 图片/PDF转MD — 小红书开源 FireRed-OCR 是一个系统化的框架,旨在将通用的大型视觉语言模型 (LVLM) 专门化为高性能、像素级精确的结构化文档解析专家
- fashn-vton-1.5 一键换装 — fashn-vton-1.5 一键换装
- MatAnyone2 视频去背景 — MatAnyone2 视频去背景
- Qwen_ImageEdit_2511 多角度 — Qwen_ImageEdit_2511 多角度
- FaceFusionFree4.3-CUDA 换脸 — FaceFusionFree4.3-CUDA 换脸
- Flux2-klein-face 换头 — Flux2-klein-face 换头
- faster-whisper 语音转字幕 — faster-whisper 语音转字幕
- whisperx 语音转字幕 — whisperx 语音转字幕
- Qwen3_ASR 语音转字幕 — Qwen3_ASR 语音转字幕
- 小红书FireRed-Image-Edit 一键提取衣物 — 小红书FireRed-Image-Edit 一键提取衣物
- sam3 图像分割 — sam3 图像分割
- Qwen3-ASR-Stream-Docker 流式转写 — Qwen3-ASR-Stream-Docker 流式转写
- Duix-Avatar开源ai数字人 — Duix-Avatar开源ai数字人