Main Content

readPDFFormData

PDF フォームからのデータの読み取り

説明

data = readPDFFormData(filename) は、PDF フォームからデータを struct に読み取ります。

data = readPDFFormData(filename,'Password',password) は、PDF フォームを開くためのパスワードを指定します。

すべて折りたたむ

readPDFFormData を使用して、weatherReportForm1.pdf のフォーム フィールドからデータを読み取ります。関数は、PDF フォーム フィールドからのデータを格納する struct を返します。

filename = "weatherReportForm1.pdf";
data = readPDFFormData(filename)
data = struct with fields:
         event_type: "Thunderstorm Wind"
    event_narrative: "Large tree down between Plantersville and Nettleton."

ファイル データストアを使用して、複数のファイルのフォーム フィールドからデータを読み取ります。

気象レポート フォーム用のファイル データストアを作成します。フォームは "weatherReportFormN.pdf" という名前です。ここで、N はフォームの番号です。ワイルドカード "*" を使用してファイル名を指定し、この構造のファイル名をすべて見つけます。読み取り関数を readPDFFormData に指定するには、関数ハンドルを使用してこの関数を fileDatastore に入力します。

fds = fileDatastore("weatherReportForm*.pdf",'ReadFcn',@readPDFFormData)
fds = 
  FileDatastore with properties:

                       Files: {
                              ' .../tp7aac4f0b/textanalytics-ex39762425/weatherReportForm1.pdf';
                              ' .../tp7aac4f0b/textanalytics-ex39762425/weatherReportForm2.pdf';
                              ' .../tp7aac4f0b/textanalytics-ex39762425/weatherReportForm3.pdf'
                               ... and 1 more
                              }
                     Folders: {
                              '/tmp/Bdoc24a_2528353_921476/tp7aac4f0b/textanalytics-ex39762425'
                              }
                 UniformRead: 0
                    ReadMode: 'file'
                   BlockSize: Inf
                  PreviewFcn: @readPDFFormData
      SupportedOutputFormats: ["txt"    "csv"    "dat"    "asc"    "xlsx"    "xls"    "parquet"    "parq"    "png"    "jpg"    "jpeg"    "tif"    "tiff"    "wav"    "flac"    "ogg"    "opus"    "mp3"    "mp4"    "m4a"]
                     ReadFcn: @readPDFFormData
    AlternateFileSystemRoots: {}

データストア内のファイルをループ処理して、各 PDF フォームを読み取ります。

data = [];
while hasdata(fds)
    textData = read(fds);
    data = [data; textData];
end
data
data=4×1 struct array with fields:
    event_type
    event_narrative

入力引数

すべて折りたたむ

ファイルの名前。string スカラーまたは文字ベクトルとして指定します。

readPDFFormData は、AcroForm PDF ファイル (インタラクティブ フォーム) のみをサポートします。

データ型: string | char

PDF ファイルを開くためのパスワード。文字ベクトルまたは string スカラーとして指定します。

例: "skroWhtaM"

データ型: string | char

出力引数

すべて折りたたむ

出力 struct。data フィールドは、PDF のフォーム フィールドの名前に対応します。フォーム フィールド名が有効な struct フィールド名ではなかった場合、関数によってそれらが自動的に編集され、有効な名前が作成されます。

バージョン履歴

R2018a で導入