Zerox:开源OCR神器,GPT-4o-mini助力文档转换
Zerox是一款利用GPT-4o-mini模型的开源OCR工具,它能够将PDF、DOCX和图像文件转换为Markdown格式,特别适合包含复杂布局、表格和图表的文档。Zerox通过将文件转换为图像,然后利用GPT模型识别内容并以Markdown格式输出,实现了高准确度的文档转换。这一工具不仅提高了OCR的灵活性和准确性,还降低了成本,预估一页文档的处理成本在0.01美金以内。Zerox提供Node和Python两种语言的实现,方便不同用户的需求,并支持批处理和格式保持。Zerox的项目链接已提供,用户可以直接试用,体验其强大的OCR功能。