Text Converter
Sheetize Text Converter for .NETは、文書をプレーンテキスト形式に変換する機能を提供し、データ抽出、アーカイブ、テキストベースのシステムとの統合に最適です。
主な機能
文書をプレーンテキストに変換
PDF、DOCX、HTMLなどの文書からテキストコンテンツを抽出し、データ処理やアーカイブに役立ちます。
プレーンテキストを文書形式に変換
プレーンテキストから書式付きの文書を作成し、レポートや構造化ファイルを生成する簡単な方法を提供します。
詳細ガイド
文書をプレーンテキストに変換する
文書をプレーンテキストに変換するには:
- コンバータの初期化:
TextConverter
のインスタンスを作成します。 - 変換オプションの設定:
DocumentToTextOptions
を使用して出力設定を構成します。 - 入力および出力パスの定義: 入力文書と出力テキストファイルのパスを設定します。
- 変換の実行:
Process
メソッドを呼び出して文書を変換します。
例: PDFをプレーンテキストに変換
// ステップ1: テキストコンバータを初期化
var converter = new TextConverter();
// ステップ2: 文書からテキストへの変換オプションを設定
var options = new DocumentToTextOptions();
// ステップ3: ファイルパスを設定
options.AddInput(new FileDataSource("input.pdf"));
options.AddOutput(new FileDataSource("output.txt"));
// ステップ4: 変換を実行
converter.Process(options);
テキストコンバータは、アーカイブの作成やプレーンテキストでのデータ処理が必要なシナリオにおいて不可欠です。