Main Content

標本データセット

Statistics and Machine Learning Toolbox™ ソフトウェアには下表の標本データセットが含まれています。

データセットを MATLAB® ワークスペース内に読み込むには、以下を入力します。

load filename

ここで、filename は、表にリストされているファイルのいずれかです。

データセットには、個々のデータ変数、参照付きの記述変数、データセットとその記述をカプセル化するデータセット配列が適宜含まれます。

ファイルデータセットの説明
acetylene.mat相関予測子をもつ化学反応データ
arrhythmia.matUCI Machine Learning Repository からの心臓不整脈データ
carbig.mat自動車の寸法 (1970~1982 年)
carsmall.matcarbig.mat のサブセット。自動車の寸法 (1970、1976、1982 年)
census1994.matUCI Machine Learning Repository の Adult データ
cereal.mat朝食シリアルの成分
cities.mat米国大都市圏の生活の質のランキング
discrim.mat判別分析のための cities.mat のバージョン
examgrades.mat0 ~ 100 のテストの採点
fisheriris.matフィッシャーのアヤメの分析データ (1936 年)
flu.matGoogle の「インフル トレンド」は米国のさまざまな地域の ILI (インフルエンザ様疾患) の比率を推定、CDC は監視組織のレポートに基づき ILI の比率を重視
gas.mat1993 年のマサチューセッツ州周辺のガソリン価格
hald.matセメントの発熱と混合成分
hogg.mat出荷別の牛乳内のバクテリア数
hospital.mat病院のデータのシミュレーション
humanactivity.mat座る、立つ、歩く、走る、踊る、という 5 種類の動作に対する行動認識データ
imports-85.matUCI リポジトリからの 1985 年の自動車輸入データベース
ionosphere.matUCI Machine Learning Repository からの電離層データセット
kmeansdata.mat4 次元にクラスター化したデータ
lawdata.mat法律学校 15 校の GPA と LSAT 得点
mileage.mat2 社の 3 モデルの車両のマイレージ データ
moore.mat5 つの予測子に基づく生物化学的酸素要求量
morse.mat非符号器によるモールス符号の区別の認識
nlpdata.matMathWorks® ドキュメンテーションから抽出した自然言語処理データ
ovariancancer.mat4000 個の予測子に基づきグループ分けされた意見[1][2]
parts.mat36 個の円形パーツの寸法のずれ
polydata.mat多項式近似用の標本データ
popcorn.matタイプ別とブランド別によるポップコーン生産量
reaction.matHougen-Watson モデルのための反応力学
spectra.mat60 件のガソリン標本の NIR スペクトル観測とオクタン価
stockreturns.mat株式収益のシミュレーション

参照

[1] Conrads, Thomas P., Vincent A. Fusaro, Sally Ross, Don Johann, Vinodh Rajapakse, Ben A. Hitt, Seth M. Steinberg, et al. "High-Resolution Serum Proteomic Features for Ovarian Cancer Detection." Endocrine-Related Cancer 11 (2004): 163–78.

[2] Petricoin, Emanuel F., Ali M. Ardekani, Ben A. Hitt, Peter J. Levine, Vincent A. Fusaro, Seth M. Steinberg, Gordon B. Mills, et al. “Use of Proteomic Patterns in Serum to Identify Ovarian Cancer.” The Lancet 359, no. 9306 (February 2002): 572–77.