🔧 DOCX 深层提取器
解压 + XML 解析
⚡ 直接解压 .docx 文件,从
word/document.xml
提取文字,从
word/media/
提取图片。
✅ 避免转换库的内部错误,更稳定。每个文档生成独立文件夹:
📁 文件夹名(原文件名)内含 同名.txt 和 图片(按原名顺序)
点击或拖放 .docx 文件
支持多选,仅处理后缀为 .docx 的文件
📋 待处理文档
清空
⚙️
开始解压 & 打包 ZIP
↻ 重置
📌 就绪,选择文件后点击“开始解压”。
💡 处理完全在浏览器本地完成,文件不会上传。
⚠️ 如果文档没有 media 文件夹,则只输出文字。图片命名保持原内部文件名(但会加上序号前缀),确保顺序。
* 文字从 <w:t> 标签提取,段落间保留一个换行。