ตัวแปลงข้อความ
The Sheetize Text Converter for .NET มีวิธีง่าย ๆ ในการแปลงไฟล์ เช่น PDF, DOCX, และ HTML ให้เป็นข้อความธรรมดาและกลับอีกด้านหนึ่ง รองรับการใช้งานเช่นการทำเหมืองข้อมูล, การจัดเก็บระยะยาว, และการโต้ตอบกับแพลตฟอร์มที่ใช้ข้อความเท่านั้น.
คุณสมบัติหลัก
สกัดข้อความจากเอกสาร
ดึงข้อมูลข้อความจากไฟล์ประเภทต่าง ๆ มีประโยชน์สำหรับไลน์การประมวลผลและการจัดเก็บเอกสาร
สร้างเอกสารจากข้อความ
สร้างไฟล์ที่มีโครงสร้างจากข้อความดิบ ทำให้การสร้างรายงานหรือผลลัพธ์ที่จัดรูปแบบง่ายขึ้น
คู่มือโดยละเอียด
แปลงเอกสารเป็นข้อความธรรมดา
ขั้นตอนการแปลงไฟล์เป็นข้อความธรรมดา:
- เตรียมตัวแปลง: Prepare
TextConverter. - ตั้งค่าตัวเลือก: Use
SaveOptionsto set conversion parameters. - ระบุไฟล์เข้า/ออก: Provide source and destination file locations.
- เรียกการทำงาน: Call
Processwith the prepared options.
ตัวอย่าง: การแปลง PDF เป็นข้อความ
var loadOptions = new LoadOptions
{
InputFile = "D:\\Input.xlsx",
};
var saveOptions = new SaveOptions
{
OutputFile = "D:\\Output.txt"
};
TextConverter.Process(loadOptions, saveOptions);ตัวแปลงนี้มีความสำคัญสำหรับสถานการณ์ที่ต้องการสกัดข้อความดิบ เช่นการสร้างคลังเอกสารที่สามารถค้นหาได้หรือการป้อนข้อมูลเข้าสู่กระบวนการทำงานที่เน้นข้อความ.