テキストコンバータ
Sheetize Text Converter for .NET は、PDF、DOCX、HTML などのファイルをプレーンテキストに、またその逆に変換するシンプルな方法を提供します。データマイニング、長期保存、テキストのみのプラットフォームとの連携といったユースケースに役立ちます。
主な機能
文書からテキストを抽出
さまざまなファイル形式からテキストデータを取り出し、処理パイプラインやアーカイブ目的で利用できます。
テキストから文書を生成
生のテキストから構造化されたファイルを作成し、レポートやフォーマット済み出力の作成を簡素化します。
詳細ガイド
文書をプレーンテキストに変換する手順
ファイルをプレーンテキストに変換する手順:
- コンバータの準備:
TextConverterを用意します。 - オプションの設定:
SaveOptionsを使って変換パラメータを設定します。 - 入出力の指定: ソースファイルと出力先ファイルの場所を指定します。
- 処理の実行: 用意したオプションを渡して
Processを呼び出します。
サンプル: PDF からテキストへの変換
var loadOptions = new LoadOptions
{
InputFile = "D:\\Input.xlsx",
};
var saveOptions = new SaveOptions
{
OutputFile = "D:\\Output.txt"
};
TextConverter.Process(loadOptions, saveOptions);このコンバータは、検索可能なアーカイブを構築したり、テキスト中心のワークフローにデータを供給したりするシナリオで重要な役割を果たします。