このページの内容は最新ではありません。最新版の英語を参照するには、ここをクリックします。
datastore
データの大規模な集合用のデータストアを作成
説明
例
サンプル ファイル airlinesmall.csv
に関連付けられたデータストアを作成します。このファイルには、1987 年から 2008 年までの航空会社のデータが格納されています。
数値列の欠損データのインポートを管理するには、名前と値の引数 "TreatAsMissing"
および "MissingValue"
を使用します。"TreatAsMissing"
の値を "NA"
、"MissingValue"
の値を 0 に指定して、インポート データで "NA"
のすべてのインスタンスを 0 に置き換えます。
ds = datastore("airlinesmall.csv","TreatAsMissing","NA",... "MissingValue",0)
ds = TabularTextDatastore with properties: Files: { 'B:\matlab\toolbox\matlab\demos\airlinesmall.csv' } Folders: { 'B:\matlab\toolbox\matlab\demos' } FileEncoding: 'UTF-8' AlternateFileSystemRoots: {} VariableNamingRule: 'modify' ReadVariableNames: true VariableNames: {'Year', 'Month', 'DayofMonth' ... and 26 more} DatetimeLocale: en_US Text Format Properties: NumHeaderLines: 0 Delimiter: ',' RowDelimiter: '\r\n' TreatAsMissing: 'NA' MissingValue: 0 Advanced Text Format Properties: TextscanFormats: {'%f', '%f', '%f' ... and 26 more} TextType: 'char' ExponentCharacters: 'eEdD' CommentStyle: '' Whitespace: ' \b\t' MultipleDelimitersAsOne: false Properties that control the table returned by preview, read, readall: SelectedVariableNames: {'Year', 'Month', 'DayofMonth' ... and 26 more} SelectedFormats: {'%f', '%f', '%f' ... and 26 more} ReadSize: 20000 rows OutputType: 'table' RowTimes: [] Write-specific Properties: SupportedOutputFormats: ["txt" "csv" "xlsx" "xls" "parquet" "parq"] DefaultOutputFormat: "txt"
datastore
は TabularTextDatastore
を作成します。
MATLAB® パスおよびそのサブフォルダー内にあるすべての .tif
ファイルを含むデータストアを作成します。
ds = datastore(fullfile(matlabroot,"toolbox","matlab"),... "IncludeSubfolders",true,"FileExtensions",".tif","Type","image")
ds = ImageDatastore with properties:
Files: {
'H:\matlab\toolbox\matlab\demos\example.tif';
'H:\matlab\toolbox\matlab\imagesci\corn.tif'
}
Folders: {
'H:\matlab\toolbox\matlab'
}
AlternateFileSystemRoots: {}
ReadSize: 1
Labels: {}
SupportedOutputFormats: ["png" "jpg" "jpeg" "tif" "tiff"]
DefaultOutputFormat: "png"
ReadFcn: @readDatastoreImage
入力引数
データストアに含めるファイルまたはフォルダー。次の値のいずれかとして指定します。
FileSet
オブジェクト — 場所をFileSet
オブジェクトとして指定すると、パスまたはDsFileSet
オブジェクトを指定した場合に比べ、データストアの構築時間が短くなります。詳細については、matlab.io.datastore.FileSet
を参照してください。DsFileSet
オブジェクト — 詳細については、matlab.io.datastore.DsFileSet
を参照してください。ファイル パス — 単一のファイル パスを string スカラーまたは文字ベクトルとして指定できます。複数のファイル パスは string 配列または文字ベクトルの cell 配列として指定できます。
ファイルまたはフォルダーはローカルでもリモートでもかまいません。
ローカルのファイルまたはフォルダー — 現在のフォルダー以外のファイルの場合は、絶対パスまたは相対パスを指定します。指定したフォルダーのサブフォルダー内にあるファイルは、自動ではデータストアに含まれません。ローカル パスを指定するときにワイルドカード文字 (*) を使用できます。この文字は、一致するフォルダー内にある、すべてのファイルまたは一致するすべてのファイルをデータストアに含めることを指定します。
リモートのファイルまたはフォルダー —
hdfs:///
の形式の Uniform Resource Locator (URL) として、リモートのファイルまたはフォルダーの絶対パスを指定します。インターネット URL には、プロトコル タイプpath_to_file
"http://"
または"https://"
を含める必要があります。詳細については、リモート データの操作を参照してください。
フォルダーを指定する場合、データストアにはサポートされているファイル形式のファイルのみが含まれ、その他の形式のファイルは無視されます。データストアに含めるファイル拡張子のカスタム リストを指定するには、名前と値の引数 FileExtensions
を参照してください。
KeyValueDatastore
の場合、location
引数は mapreduce
関数で生成された MAT ファイルまたはシーケンス ファイルでなければなりません。MAT ファイルはローカル ファイル システムまたはネットワーク ファイル システムになければなりません。シーケンス ファイルは、ローカル、ネットワークまたは HDFS™ のファイル システムに配置できます。DatabaseDatastore
型のデータストアの場合、location
引数はファイルである必要はありません。詳細については、DatabaseDatastore
(Database Toolbox) を参照してください。
例: "file1.csv"
例: "../dir/data/file1.jpg"
例: ["C:\dir\data\file1.xls","C:\dir\data\file2.xlsx"]
例: "C:\dir\data\*.mat"
例: "hdfs:///data/file1.txt"
名前と値の引数
オプションの引数のペアを Name1=Value1,...,NameN=ValueN
として指定します。ここで、Name
は引数名で、Value
は対応する値です。名前と値の引数は他の引数の後に指定しなければなりませんが、ペアの順序は重要ではありません。
例: datastore("myfolder","FileExtensions"=[".jpg",".tif"])
は、ImageDatastore
オブジェクトについて、.jpg
または .tif
の拡張子をもつすべてのファイルを含めます。
R2021a より前では、コンマを使用して名前と値をそれぞれ区切り、Name
を引用符で囲みます。
例: datastore("myfolder","FileExtensions",[".jpg",".tif"])
は、ImageDatastore
オブジェクトについて、.jpg
または .tif
の拡張子をもつすべてのファイルを含めます。
データストアの種類。'Type'
と次のいずれかで構成されるコンマ区切りのペアとして指定します。
'Type' の値 | 説明 |
---|---|
'tabulartext' | 表形式データを含むテキスト ファイル。データのエンコードは ASCII または UTF-8 でなければなりません。 |
'image' | JPEG や PNG などの形式のイメージ ファイル。使用できるファイルには imformats 形式が含まれます。 |
'spreadsheet' | 1 つ以上のシートを含むスプレッドシート ファイル。 |
'keyvalue' | MAT ファイルまたはシーケンス ファイルに含まれ、mapreduce で生成したデータをもつキーと値のペアのデータ。詳細については、KeyValueDatastore を参照してください。 |
'file' | データの読み取りに指定の読み取り関数を必要とするカスタム形式ファイル。詳細については、FileDatastore を参照してください。 |
'tall' | tall データ型の関数 write によって生成された MAT ファイルまたはシーケンス ファイル。詳細については、TallDatastore を参照してください。 |
'parquet' | 列方向データを含む Parquet ファイル。詳細については、ParquetDatastore を参照してください。 |
'database' | データベースに保存されたデータ。Database Toolbox™ が必要です。type パラメーターを使用する場合は、追加の入力引数を指定する必要があります。詳細については、DatabaseDatastore (Database Toolbox) を参照してください。 |
ファイル形式をサポートする種類が複数ある場合は、引数
'Type'
を使用してデータストアの種類を指定します。'Type'
の値を指定しない場合、作成するデータストアの適切な種類はファイルの拡張子に基づいてdatastore
により自動的に判別されます。
データ型: char
| string
フォルダー内のサブフォルダーを含めるかどうか。'IncludeSubfolders'
と、true
(1) または false
(0) で構成されるコンマ区切りのペアとして指定します。各フォルダー内のすべてのファイルとサブフォルダーを含めるには true
を指定し、各フォルダー内のファイルのみを含めるには false
を指定します。
'IncludeSubfolders'
を指定しない場合、既定値は false
です。
'IncludeSubfolders'
の名前と値のペアは、次のオブジェクトを作成する場合にのみ有効です。
TabularTextDatastore
ImageDatastore
SpreadsheetDatastore
FileDatastore
KeyValueDatastore
ParquetDatastore
例: 'IncludeSubfolders',true
データ型: logical
| double
ファイルの拡張子。'FileExtensions'
と、文字ベクトル、文字ベクトルの cell 配列、string スカラーまたは string 配列で構成されるコンマ区切りのペアとして指定します。'FileExtensions'
を指定する場合は 'Type'
も指定します。空の引用符 ''
を使用して、拡張子のないファイルを表すことができます。
'FileExtensions'
を指定しない場合、データストアの種類に応じて、サポートされるすべてのファイル拡張子が datastore
により自動的に含められます。サポートされていない拡張子を含める場合は、含める拡張子を個々に指定します。
TabularTextDatastore
オブジェクトの場合、サポートされる拡張子には.txt
、.csv
、.dat
、.dlm
、.asc
および.text
が含まれます。また、拡張子がない場合もサポートされます。ImageDatastore
オブジェクトの場合、サポートされる拡張子にはすべてのimformats
が含まれます。SpreadsheetDatastore
オブジェクトの場合、サポートされる拡張子には.xls
、.xlsx
、.xlsm
、.xltx
および.xltm
が含まれます。TallDatastore
オブジェクトの場合、サポートされる拡張子には.mat
および.seq
が含まれます。ParquetDatastore
オブジェクトの場合、サポートされる拡張子には.parquet
および.parq
が含まれます。
'FileExtensions'
の名前と値のペアは、次のオブジェクトを作成する場合にのみ有効です。
TabularTextDatastore
ImageDatastore
SpreadsheetDatastore
FileDatastore
KeyValueDatastore
ParquetDatastore
例: 'FileExtensions','.jpg'
例: 'FileExtensions',{'.txt','.text'}
データ型: char
| cell
| string
代替ファイル システムのルート パス。"AlternateFileSystemRoots"
と string ベクトルまたは cell 配列で構成される名前と値の引数として指定します。ローカル マシン上にデータストアを作成するが、別のマシン (異なるオペレーティング システムの可能性がある) 上でデータにアクセスして処理する必要がある場合は、"AlternateFileSystemRoots"
を使用します。また、Parallel Computing Toolbox™ と MATLAB® Parallel Server™ を使用してデータを処理し、そのデータがローカル マシンに保存され、そのデータのコピーが異なるプラットフォームのクラウドやクラスター マシンにある場合、"AlternateFileSystemRoots"
を使用してルート パスを関連付けなければなりません。
相互に対応する 1 組のルート パスを関連付けるには、
"AlternateFileSystemRoots"
を string ベクトルとして指定します。以下に例を示します。["Z:\datasets","/mynetwork/datasets"]
データストアに対応する複数の組のルート パスを関連付けるには、複数行を含む cell 配列として
"AlternateFileSystemRoots"
を指定します。各行は対応するルート パスの組を表します。cell 配列内の各行を string ベクトル、または文字ベクトルの cell 配列のいずれかとして指定します。以下に例を示します。"AlternateFileSystemRoots"
を string ベクトルの cell 配列として指定します。{["Z:\datasets", "/mynetwork/datasets"];... ["Y:\datasets", "/mynetwork2/datasets","S:\datasets"]}
あるいは、
"AlternateFileSystemRoots"
を文字ベクトルの cell 配列からなる cell 配列として指定します。{{'Z:\datasets','/mynetwork/datasets'};... {'Y:\datasets', '/mynetwork2/datasets','S:\datasets'}}
"AlternateFileSystemRoots"
の値は、次の条件を満たさなければなりません。
1 行以上の行を含み、各行は 1 組の対応するルート パスを指定する。
各行は複数のルート パスを指定し、各ルート パスは 2 文字以上を含まなければならない。
ルート パスは一意で、他のルート パスのサブフォルダーではない。
ファイルの場所を指す 1 つ以上のルート パス エントリを含む。
詳細については、異なるマシンまたはクラスターで処理するためのデータストアの設定を参照してください。
例: ["Z:\datasets","/mynetwork/datasets"]
データ型: string
| cell
テキスト変数の出力データ型。'TextType'
と 'char'
または 'string'
のいずれかで構成されるコンマ区切りのペアとして指定します。関数 read
、readall
または preview
の出力テーブルにテキスト変数が含まれる場合、'TextType'
は、TabularTextDatastore
オブジェクトおよび SpreadsheetDatastore
オブジェクトについてのみ、それらの変数のデータ型を指定します。'TextType'
が 'char'
の場合、出力は文字ベクトルの cell 配列です。'TextType'
が 'string'
の場合、出力の型は string
です。
データ型: char
| string
インポートされる日付と時刻のデータの型。'DatetimeType'
と、'datetime'
または 'text'
のいずれかの値で構成されるコンマ区切りのペアとして指定します。'DatetimeType'
引数は、TabularTextDatastore
オブジェクトを作成する場合にのみ適用されます。
値 | インポートされる日付と時刻のデータの型 |
---|---|
'datetime' | MATLAB の 詳細については、 |
'text' |
|
例: 'DatetimeType','datetime'
データ型: char
| string
テキスト ファイルからの duration データの出力データ型。'DurationType'
と 'duration'
または 'text'
のいずれかで構成されるコンマ区切りのペアとして指定します。
値 | インポートされる duration データの型 |
---|---|
'duration' | MATLAB の 詳細については、 |
'text' |
|
データ型: char
| string
| datetime
変数名を保持するかどうかのフラグ。"modify"
または "preserve"
として指定します。
"modify"
— 無効な変数名 (関数isvarname
で判定) を、有効な MATLAB 識別子に変換。"preserve"
— スペースや非 ASCII 文字を含む変数名など、有効な MATLAB 識別子ではない変数名を保持。
R2019b 以降、変数名と行名には、スペースや非 ASCII 文字など任意の文字を含めることができます。また、英字だけでなく任意の文字で始めることができます。変数名と行名は、有効な MATLAB 識別子 (関数 isvarname
で判定) である必要はありません。これらの変数名と行名を保持するには、VariableNamingRule
の値を "preserve"
に設定します。VariableNamingRule
の値を "modify"
から "preserve"
に変更すると、変数名が更新されなくなります。
データ型: char
| string
これらの名前と値のペアに加えて、次のオブジェクトの任意のプロパティも名前と値のペアとして指定できます。ただし、Files
プロパティを除きます。
出力引数
データの集合のデータストア。TabularTextDatastore
、ImageDatastore
、SpreadsheetDatastore
、KeyValueDatastore
、FileDatastore
、TallDatastore
、ParquetDatastore
、または DatabaseDatastore
の各オブジェクトのいずれかとして返されます。データストアの種類は、ファイルの種類または引数 location
によって決まります。詳細については、次の表のデータストア名をクリックしてください。
タイプ | 出力 |
---|---|
テキスト ファイル | TabularTextDatastore |
イメージ ファイル | ImageDatastore |
スプレッドシート ファイル | SpreadsheetDatastore |
mapreduce によって生成された MAT ファイルまたはシーケンス ファイル | KeyValueDatastore |
カスタム形式ファイル | FileDatastore |
tall データ型の関数 write によって生成された MAT ファイルまたはシーケンス ファイル。 | TallDatastore |
Parquet ファイル | ParquetDatastore |
データベース | DatabaseDatastore (Database Toolbox) |
これらの各データストアの種類の場合、Files
プロパティは文字ベクトルの cell 配列です。個々の文字ベクトルは、location
引数に関連付けられたファイルへの絶対パスです。
制限
MATLAB では、認証が必要なインターネット URL はサポートされていません。
MATLAB Online™ では Microsoft® OneDrive™ ファイルおよびフォルダーに関連付けられたインターネット URL はサポートされていますが、MATLAB のインストール バージョンではローカル OneDrive ファイルのみがサポートされています。
バージョン履歴
R2014b で導入インターネット URL を介してデータストア操作を実行することで、主要なオンライン ソースからデータを読み取ることができます。
MATLAB Command
You clicked a link that corresponds to this MATLAB command:
Run the command by entering it in the MATLAB Command Window. Web browsers do not support MATLAB commands.
Web サイトの選択
Web サイトを選択すると、翻訳されたコンテンツにアクセスし、地域のイベントやサービスを確認できます。現在の位置情報に基づき、次のサイトの選択を推奨します:
また、以下のリストから Web サイトを選択することもできます。
最適なサイトパフォーマンスの取得方法
中国のサイト (中国語または英語) を選択することで、最適なサイトパフォーマンスが得られます。その他の国の MathWorks のサイトは、お客様の地域からのアクセスが最適化されていません。
南北アメリカ
- América Latina (Español)
- Canada (English)
- United States (English)
ヨーロッパ
- Belgium (English)
- Denmark (English)
- Deutschland (Deutsch)
- España (Español)
- Finland (English)
- France (Français)
- Ireland (English)
- Italia (Italiano)
- Luxembourg (English)
- Netherlands (English)
- Norway (English)
- Österreich (Deutsch)
- Portugal (English)
- Sweden (English)
- Switzerland
- United Kingdom (English)