Text Converter
.NET용 Sheetize Text Converter는 문서를 일반 텍스트 형식으로 변환할 수 있게 해주며, 데이터 추출, 아카이빙, 텍스트 기반 시스템과의 통합에 이상적입니다.
주요 기능
문서를 일반 텍스트로 변환
PDF, DOCX, HTML과 같은 문서에서 텍스트 콘텐츠를 추출하며, 데이터 처리 및 아카이빙에 유용합니다.
일반 텍스트를 문서 형식으로 변환
일반 텍스트에서 서식 있는 문서를 생성하여, 보고서 또는 구조화된 파일을 쉽게 생성할 수 있습니다.
상세 가이드
문서를 일반 텍스트로 변환하기
문서를 일반 텍스트로 변환하려면:
- 변환기 초기화:
TextConverter
의 인스턴스를 생성합니다. - 변환 옵션 설정:
DocumentToTextOptions
를 사용하여 출력 설정을 구성합니다. - 입력 및 출력 경로 정의: 입력 문서와 출력 텍스트 파일의 경로를 설정합니다.
- 변환 실행:
Process
메서드를 호출하여 문서를 변환합니다.
예시: PDF를 일반 텍스트로 변환
// 단계 1: 텍스트 변환기 초기화
var converter = new TextConverter();
// 단계 2: 문서에서 텍스트로 변환을 위한 옵션 설정
var options = new DocumentToTextOptions();
// 단계 3: 파일 경로 설정
options.AddInput(new FileDataSource("input.pdf"));
options.AddOutput(new FileDataSource("output.txt"));
// 단계 4: 변환 실행
converter.Process(options);
텍스트 추출이 필요한 경우, 예를 들어 아카이브를 생성하거나 일반 텍스트로 데이터를 처리하는 시나리오에 텍스트 변환기가 필수적입니다.