テキストコンバーター

Sheetize Text Converter for .NET は、データ抽出、アーカイブ、およびテキストベースのシステムとの統合に最適なフラットフォーマットから文書の変換を可能にします。

主な特徴

文書を平らなテキストに変換

PDF、DOCX、HTMLなどの文書からテキストコンテンツを抽出し、データ処理およびアーカイブに役立ちます。

平板テキストをドキュメント形式に変換する

フラットテキストからフォーマットされたドキュメントを作成し、レポートや構造化されたファイルを生成する簡単な方法を提供します。

詳細ガイド

文書を平らなテキストに変換

文書を明確なテキストに変換するには:

  • Initialize the Converter : インスタンスを作成する TextConverter.
  • セット 変換オプション :使用 DocumentToTextOptions 出力設定を設定する。
  • 入力と出力パスを定義する :入力を文書および出力をテキストファイルに設定するパスを設定します。
  • 変換を実行する :Call the Process 文書を変換する方法

例:PDFを平板テキストに変換する

// Step 1: Initialize the Text Converter
var converter = new TextConverter();

// Step 2: Configure options for document to text conversion
var options = new DocumentToTextOptions();

// Step 3: Set file paths
options.AddInput(new FileDataSource("input.pdf"));
options.AddOutput(new FileDataSource("output.txt"));

// Step 4: Execute the conversion
converter.Process(options);

Text Converter は、テキスト抽出が必要なシナリオ、例えばアーカイブを作成したり、データをフラットテクストで処理したりするために不可欠です。

 日本語