텍스트 변환기

.NET용 Sheetize Text Converter는 PDF, DOCX, HTML과 같은 파일을 일반 텍스트로 변환하고 다시 되돌리는 간단한 방법을 제공하며, 데이터 마이닝, 장기 보관, 텍스트 전용 플랫폼과의 상호 작용 등의 사용 사례를 지원합니다.

주요 기능

문서에서 텍스트 추출

다양한 파일 형식에서 텍스트 데이터를 추출하여 처리 파이프라인 및 아카이브 목적에 활용할 수 있습니다.

텍스트에서 문서 생성

원시 텍스트를 기반으로 구조화된 파일을 만들고, 보고서나 포맷된 출력물을 손쉽게 생성할 수 있습니다.


상세 가이드

문서를 일반 텍스트로 변환하기

파일을 일반 텍스트로 변환하는 단계:

  1. 컨버터 준비: TextConverter 준비하기.
  2. 옵션 설정: 변환 매개변수를 지정하려면 SaveOptions 사용하기.
  3. 입출력 지정: 소스 파일과 대상 파일 위치를 제공하기.
  4. 프로세스 실행: 준비된 옵션으로 Process 호출하기.

예시: PDF를 텍스트로 변환

var loadOptions = new LoadOptions
{
    InputFile = "D:\\Input.xlsx",

};
var saveOptions = new SaveOptions
{
    OutputFile = "D:\\Output.txt"
};

TextConverter.Process(loadOptions, saveOptions);

이 컨버터는 검색 가능한 아카이브를 구축하거나 텍스트 중심 워크플로에 데이터를 제공하는 등 원시 텍스트 추출이 필요한 시나리오에 필수적입니다.

 한국어