テキストコンバータ

Sheetize Text Converter for .NET は、PDF、DOCX、HTML などのファイルをプレーンテキストに、またその逆に変換するシンプルな方法を提供します。データマイニング、長期保存、テキストのみのプラットフォームとの連携といったユースケースに役立ちます。

主な機能

文書からテキストを抽出

さまざまなファイル形式からテキストデータを取り出し、処理パイプラインやアーカイブ目的で利用できます。

テキストから文書を生成

生のテキストから構造化されたファイルを作成し、レポートやフォーマット済み出力の作成を簡素化します。


詳細ガイド

文書をプレーンテキストに変換する手順

ファイルをプレーンテキストに変換する手順:

  1. コンバータの準備: TextConverter を用意します。
  2. オプションの設定: SaveOptions を使って変換パラメータを設定します。
  3. 入出力の指定: ソースファイルと出力先ファイルの場所を指定します。
  4. 処理の実行: 用意したオプションを渡して Process を呼び出します。

サンプル: PDF からテキストへの変換

var loadOptions = new LoadOptions
{
    InputFile = "D:\\Input.xlsx",

};
var saveOptions = new SaveOptions
{
    OutputFile = "D:\\Output.txt"
};

TextConverter.Process(loadOptions, saveOptions);

このコンバータは、検索可能なアーカイブを構築したり、テキスト中心のワークフローにデータを供給したりするシナリオで重要な役割を果たします。

 日本語