Aspose.OCR for Java 允许您从图像、屏幕截图、图像的特定区域中提取文本,并在任何支持 Java 的平台上从扫描文件创建可搜索的 PDF。凭借其强大且易于使用的 API,即使是复杂的 OCR 任务也只需不到 10 行代码。您无需使用公式和机器学习 - 该库将处理所有技术细节,并以基于拉丁文和西里尔文字的26种语言以及中文生成可靠的结果. OCR API 处理扫描图像、智能手机照片、屏幕截图、图像区域和扫描 PDF,并以最流行的文档格式返回结果。通过跨多个 CPU 内核分配计算并将资源密集型任务卸载到GPU ,可以进一步提高识别速度、准确性和性能。
Aspose.OCR for Java 的特性和功能
识别扫描图像和 PDF 中的格式化文本
支持您可以从扫描仪或照相机获得的所有文件格式
读取拉丁文和西里尔文字
识别6000多个汉字
检测并识别所有流行的字体
小心保留字体样式和格式
仅处理整个图像或选定区域
支持旋转、倾斜和嘈杂的图像
批量识别文件夹或档案中的所有图像
识别作为网络链接提供的图像
查找并自动更正拼写错误的单词
与其他 Aspose 产品 100% 兼容
易于安装
您可以按照简单的安装说明直接从基于Maven的项目中使用 Aspose.OCR for Java 。
申请临时许可证,开始构建功能齐全的 OCR 应用程序,没有任何限制。
便于使用
图像识别需要几行代码。字面上地。真的就这么简单——试试你自己:
将文件拖放到此处或单击以浏览 *
保加利亚语中国人克罗地亚语捷克语丹麦语荷兰语英语爱沙尼亚语芬兰法语 德语 意大利语 拉脱维亚语立陶宛语挪威 抛光葡萄牙语罗马尼亚语俄语塞尔维亚斯洛伐克语斯洛文尼亚语西班牙语瑞典 乌克兰
* 上传文件或使用服务即表示您同意我们的使用条款和隐私政策。
实时代码示例 - Java
// Create instance of OCR API
AsposeOCR api = new AsposeOCR();
try {
// Recognize image
String result = api.RecognizePage("<file name>");
// Display the recognition result
System.out.println(result);
} catch (IOException e) {
// Error handling
e.printStackTrace();
}
26种识别语言
OCR API 支持多种语言和所有流行的书写脚本,包括混合语言的文本。内置拼写检查器自动替换拼写错误的单词,免去您手动更正识别结果的麻烦。
- 扩展拉丁字母表:克罗地亚语、捷克语、丹麦语、荷兰语、英语、爱沙尼亚语、芬兰语、法语、德语、意大利语、拉脱维亚语、立陶宛语、挪威语、波兰语、葡萄牙语、罗马尼亚语、斯洛伐克语、斯洛文尼亚语、西班牙语、瑞典语。
- 西里尔字母:白俄罗斯语、保加利亚语、哈萨克语、俄语、塞尔维亚语、乌克兰语。
- 中文:6000多个字。
您可以指定语言以提高识别性能和可靠性,或者让 API 自动检测语言。
保留格式
OCR API 以常规、粗体和斜体样式读取所有流行字体,例如 Arial、Times New Roman、Courier New、Tahoma、Calibri 等,并仔细保留 OCR 结果中的格式。您还可以将识别结果拆分为多行并检测页面中的文本区域。
识别照片
扫描仪在最终用户工作站上并不总是可用,这可能会成为 OCR 应用程序的障碍。我们的 OCR API 提供了许多预处理过滤器,可以处理扭曲、旋转、倾斜和嘈杂的图像。结合对所有图像格式的支持,它甚至可以可靠地识别智能手机照片。大部分预处理和图像校正都是自动完成的,但您始终可以在困难的情况下进行干预。
应用图像校正 - Java
// Create instance of OCR API
AsposeOCR api = new AsposeOCR();
// Define pre-processing filters
PreprocessingFilter filters = new PreprocessingFilter();
filters.add(PreprocessingFilter.ToGrayscale());
filters.add(PreprocessingFilter.Rotate(-90));
// Pre-process image before recognition
BufferedImage imageRes = api.PreprocessImage(imagePath, filters);
// Recognize image
RecognitionResult result = api.RecognizePage(imageRes, set);
性能优化
光学字符识别需要大量的处理资源,这可能成为网络服务和入门级设备的问题。API 提供了非常灵活的方式来平衡识别速度、资源需求和准确性:
- 在彻底识别和快速识别之间进行选择。
- 指定为识别分配的线程数,或允许库自动扩展到 CPU 核心数。
- 通过将计算卸载到 GPU 来释放 CPU。
快速识别 - Java
// Create instance of OCR API
AsposeOCR api = new AsposeOCR();
// Recognize image in the fastest mode
String result = api.RecognizePageFast("sample.jpg");
批量处理
OCR API 提供了多种批处理方法,让您可以在一次调用中识别多张图像,从而使您不必一次识别每张图像:
- 识别多页 PDF 和 TIFF 文件。
- 识别档案中的所有文件。
- 识别文件夹中的所有文件。