Text Converter

Sheetize Text Converter for .NETは、文書をプレーンテキスト形式に変換する機能を提供し、データ抽出、アーカイブ、テキストベースのシステムとの統合に最適です。

主な機能

文書をプレーンテキストに変換

PDF、DOCX、HTMLなどの文書からテキストコンテンツを抽出し、データ処理やアーカイブに役立ちます。

プレーンテキストを文書形式に変換

プレーンテキストから書式付きの文書を作成し、レポートや構造化ファイルを生成する簡単な方法を提供します。


詳細ガイド

文書をプレーンテキストに変換する

文書をプレーンテキストに変換するには:

  1. コンバータの初期化: TextConverterのインスタンスを作成します。
  2. 変換オプションの設定: DocumentToTextOptionsを使用して出力設定を構成します。
  3. 入力および出力パスの定義: 入力文書と出力テキストファイルのパスを設定します。
  4. 変換の実行: Processメソッドを呼び出して文書を変換します。

例: PDFをプレーンテキストに変換

// ステップ1: テキストコンバータを初期化
var converter = new TextConverter();

// ステップ2: 文書からテキストへの変換オプションを設定
var options = new DocumentToTextOptions();

// ステップ3: ファイルパスを設定
options.AddInput(new FileDataSource("input.pdf"));
options.AddOutput(new FileDataSource("output.txt"));

// ステップ4: 変換を実行
converter.Process(options);

テキストコンバータは、アーカイブの作成やプレーンテキストでのデータ処理が必要なシナリオにおいて不可欠です。

 日本語