MATLAB ヘルプ センター
このページの内容は最新ではありません。最新版の英語を参照するには、ここをクリックします。
PDF フォームからのデータの読み取り
data = readPDFFormData(filename)
data = readPDFFormData(filename,'Password',password)
data = readPDFFormData(filename) は、PDF フォームからデータを struct に読み取ります。
data
filename
例
data = readPDFFormData(filename,'Password',password) は、PDF フォームを開くためのパスワードを指定します。
password
すべて折りたたむ
readPDFFormData を使用して、weatherReportForm1.pdf のフォーム フィールドからデータを読み取ります。関数は、PDF フォーム フィールドからのデータを格納する struct を返します。
readPDFFormData
weatherReportForm1.pdf
filename = "weatherReportForm1.pdf"; data = readPDFFormData(filename)
data = struct with fields: event_type: "Thunderstorm Wind" event_narrative: "Large tree down between Plantersville and Nettleton."
ファイル データストアを使用して、複数のファイルのフォーム フィールドからデータを読み取ります。
気象レポート フォーム用のファイル データストアを作成します。フォームは "weatherReportFormN.pdf" という名前です。ここで、N はフォームの番号です。ワイルドカード "*" を使用してファイル名を指定し、この構造のファイル名をすべて見つけます。読み取り関数を readPDFFormData に指定するには、関数ハンドルを使用してこの関数を fileDatastore に入力します。
"weatherReportFormN.pdf"
N
fileDatastore
fds = fileDatastore("weatherReportForm*.pdf",'ReadFcn',@readPDFFormData)
fds = FileDatastore with properties: Files: { ' .../tpac8e1975/textanalytics-ex39762425/weatherReportForm1.pdf'; ' .../tpac8e1975/textanalytics-ex39762425/weatherReportForm2.pdf'; ' .../tpac8e1975/textanalytics-ex39762425/weatherReportForm3.pdf' ... and 1 more } Folders: { '/tmp/Bdoc25a_2864802_439041/tpac8e1975/textanalytics-ex39762425' } UniformRead: 0 ReadMode: 'file' BlockSize: Inf PreviewFcn: @readPDFFormData SupportedOutputFormats: ["txt" "csv" "dat" "asc" "xlsx" "xls" "parquet" "parq" "png" "jpg" "jpeg" "tif" "tiff" "wav" "flac" "ogg" "opus" "mp3" "mp4" "m4a"] ReadFcn: @readPDFFormData AlternateFileSystemRoots: {}
データストア内のファイルをループ処理して、各 PDF フォームを読み取ります。
data = []; while hasdata(fds) textData = read(fds); data = [data; textData]; end data
data=4×1 struct array with fields: event_type event_narrative
ファイルの名前。string スカラーまたは文字ベクトルとして指定します。
readPDFFormData は、AcroForm PDF ファイル (インタラクティブ フォーム) のみをサポートします。
データ型: string | char
string
char
PDF ファイルを開くためのパスワード。文字ベクトルまたは string スカラーとして指定します。
例: "skroWhtaM"
"skroWhtaM"
出力 struct。data フィールドは、PDF のフォーム フィールドの名前に対応します。フォーム フィールド名が有効な struct フィールド名ではなかった場合、関数によってそれらが自動的に編集され、有効な名前が作成されます。
R2018a で導入
pdfinfo | extractFileText | extractHTMLText | writeTextDocument | tokenizedDocument
pdfinfo
extractFileText
extractHTMLText
writeTextDocument
tokenizedDocument
You clicked a link that corresponds to this MATLAB command:
Run the command by entering it in the MATLAB Command Window. Web browsers do not support MATLAB commands.
Web サイトの選択
Web サイトを選択すると、翻訳されたコンテンツにアクセスし、地域のイベントやサービスを確認できます。現在の位置情報に基づき、次のサイトの選択を推奨します:
また、以下のリストから Web サイトを選択することもできます。
最適なサイトパフォーマンスの取得方法
中国のサイト (中国語または英語) を選択することで、最適なサイトパフォーマンスが得られます。その他の国の MathWorks のサイトは、お客様の地域からのアクセスが最適化されていません。
南北アメリカ
ヨーロッパ
アジア太平洋地域
最寄りの営業オフィスへのお問い合わせ