LEADTOOLS 是一个综合工具包的集合,用于将识别、文档、医疗、成像和多媒体技术整合到桌面、服务器、平板电脑、网络和移动解决方案中,是一项企业级文档自动化解决方案,有捕捉,OCR,OMR,表单识别和处理,PDF,打印捕获,归档,注释和显示功能。利用业界领先的图像处理技术,能够智能识别文件,可以用来识别任何类型的扫描或传真形式的图像。
教程展示了如何LEADDocument使用 LEADTOOLS SDK 在 C# .NET Core 应用程序中向 a 添加页面和从中删除页面。
概括 | AutoFormsEngine本教程介绍如何使用C# .NET Core 控制台应用程序中的高级类识别和处理表单。 |
完成时间 | 30分钟 |
视觉工作室项目 | 下载教程项目 (2 KB) |
平台 | C# .NET Core 控制台应用程序 |
IDE | 视觉工作室 2019、2022 |
开发许可证 | 下载 LEADTOOLS |
创建项目并添加 LEADTOOLS 参考
从添加引用和设置许可证教程中创建的项目的副本开始。如果您没有该项目,请按照该教程中的步骤创建它。
所需的参考资料取决于项目的目的。可以通过 NuGet 包添加引用。
本教程需要以下 NuGet 包:
- Leadtools.Document.Sdk
有关您的应用程序需要哪些 DLL 文件的完整列表,请参阅您的应用程序中包含的文件。
设置许可文件
许可证解锁项目所需的功能。它必须在调用任何工具包函数之前设置。有关详细信息,包括针对不同平台的教程,请参阅设置运行时许可证。
有两种类型的运行时许可证:
- 评估许可证,在下载评估工具包时获得。它允许评估工具包。
- 部署许可证。如果需要部署许可证文件和开发人员密钥,请参阅获取许可证。
初始化 AutoFormsEngine、RasterCodes、IOcrEngine 和 DiskMasterFormsRepository
创建项目、添加参考和许可证集后,就可以开始编码了。
在解决方案资源管理器中,打开Program.cs. 将以下语句添加using到Program.cs.
【C#】
using System;
using System.IO;
using Leadtools;
using Leadtools.Codecs;
using Leadtools.Document;
using Leadtools.Forms.Auto;
using Leadtools.Forms.Processing;
using Leadtools.Forms.Recognition;
using Leadtools.Ocr;
将以下全局变量添加到Program类中。
【C#】
static AutoFormsEngine autoEngine;
static RasterCodecs codecs;
static IOcrEngine ocrEngine;
static DiskMasterFormsRepository formsRepository;
Program向名为的类添加一个新方法InitFormsEngines()。调用set license调用下面的InitFormsEngines()方法里面的Main()方法,如下图。
【C#】
static void Main(string[] args)
{
if (!SetLicense())
Console.WriteLine("Error setting license");
else
Console.WriteLine("License file set successfully");
InitFormsEngines();
}
将以下代码添加到InitFormsEngines()方法中以初始化AutoFormsEngine、RasterCodecs、IOcrEngine和DiskMasterFormsRepository对象。
static void InitFormsEngines()
{
codecs = new RasterCodecs();
ocrEngine = OcrEngineManager.CreateEngine(OcrEngineType.LEAD);
ocrEngine.Startup(codecs, null, null, @"C:\LEADTOOLS22\Bin\Common\OcrLEADRuntime");
formsRepository = new DiskMasterFormsRepository(codecs, @"C:\LEADTOOLS22\Resources\Images\Forms\MasterForm Sets\OCR");
autoEngine = new AutoFormsEngine(formsRepository, ocrEngine, null, AutoFormsRecognitionManager.Default | AutoFormsRecognitionManager.Ocr, 30, 80, true);
Console.WriteLine("Engines initialized successfully!");
}
添加表单识别和处理代码
在Program类中添加两个名为RecognizeAndProcessForm()和的新方法ShowProcessedResults(AutoFormsRunResult runResult)。在方法之后调用RecognizeAndProcessForm()方法内部的方法,如下一节所示。在方法的底部调用方法,作为重载传递,如下所示。MainInitFormsEngines()ShowProcessedResults()runResultRecognizeAndProcessForm()
将以下代码添加到RecognizeAndProcessForm()方法中,以根据主表单识别给定表单并处理表单以提取所需信息。
static void RecognizeAndProcessForm()
{
try
{
string resultMessage = "Form not recognized";
string formToRecognize = @"C:\LEADTOOLS22\Resources\Images\Forms\Forms to be Recognized\OCR\W9_OCR_Filled.tif";
AutoFormsRunResult runResult = autoEngine.Run(formToRecognize, null);
if (runResult != null)
{
FormRecognitionResult recognitionResult = runResult.RecognitionResult.Result;
resultMessage = $@"This form has been recognized as a {runResult.RecognitionResult.MasterForm.Name} with {recognitionResult.Confidence}% confidence.";
}
Console.WriteLine("Recognition Results:");
Console.WriteLine(resultMessage);
Console.WriteLine("=========================================================================");
ShowProcessedResults(runResult);
}
catch (Exception ex)
{
Console.WriteLine(ex.Message);
}
}
将以下代码添加到ShowProcessedResults()方法中,以将方法的处理结果显示RecognizeAndProcessForm()到控制台。
// Output Processed Results
private static void ShowProcessedResults(AutoFormsRunResult runResult)
{
if (runResult == null)
return;
string resultsMessage = "";
try
{
foreach (FormPage formPage in runResult.FormFields)
foreach (FormField field in formPage)
if (field != null)
resultsMessage = $"{resultsMessage}{field.Name} = {(field.Result as TextFormFieldResult).Text}\n";
}
catch (Exception ex)
{
Console.WriteLine(ex.Message);
}
if (string.IsNullOrEmpty(resultsMessage))
{
Console.WriteLine("Field Processing Results");
Console.WriteLine("No fields were processed");
Console.WriteLine("Press any key to exit . . .");
Console.ReadKey(true);
}
else
{
Console.WriteLine("Field Processing Results:");
Console.WriteLine(resultsMessage);
Console.WriteLine("Press any key to exit . . .");
Console.ReadKey(true);
}
}
LEADTOOLS SDK 随附并安装的是样本主表单集和样本填写表单,用于识别和处理。本教程使用这些示例。示例文件安装在<INSTALL_DIR>\LEADTOOLS22\Resources\Images\Forms.
关闭 OCR 引擎
static void Main(string[] args)
{
if (!SetLicense())
Console.WriteLine("Error setting license");
else
Console.WriteLine("License file set successfully");
InitFormsEngines();
RecognizeAndProcessForm();
autoEngine.Dispose();
if (ocrEngine != null && ocrEngine.IsStarted)
ocrEngine.Shutdown();
}
处理流
如果您想使用内存流加载表单,请在下面的RecognizeAndProcessForm()方法中添加以下代码string formToRecognize = @"C:\LEADTOOLS22\Resources\Images\Forms\Forms to be Recognized\OCR\W9_OCR_Filled.tif";:
【C#】
using (var stream = File.OpenRead(formToRecognize))
{
var options = new LoadDocumentOptions();
using (var document = DocumentFactory.LoadFromStream(stream, options))
{
// Console commands to double check that the document was loaded properly
Console.WriteLine(document.DocumentId);
Console.WriteLine("Document loaded");
}
}
按F5或选择Debug -> Start Debugging运行项目。
如果正确执行了这些步骤,则会出现控制台并显示以下数据结果:
- 公认的形式和置信度值(例如,置信度为 98% 的 W9。)
- 处理后的填写数据(例如,公司名称、地址等)
在此示例中,使用了 W-9 表格。它被正确识别,置信度为 98%(其中 0 表示没有置信度,100% 表示完全置信度)。