Main Content

eraseTags

テキストからの HTML および XML のタグの消去

説明

newStr = eraseTags(str) は、HTML および XML のコメントとタグを str の要素から消去します。

関数は、タグ名が aabbracronymbbdibdobigcodedeldfnemfontiinskbdmarkrprtrubyssmallspanstrikestrongsubsupttuvarwbr の場合はコメントとタグを消去し、他のすべてのタグはスペースに置き換えます。

ヒント

関数 eraseTags は、HTML および XML の "タグ" のみを消去します。HTML および XML の "要素" は消去されません。つまり、この関数は <X> の形式のタグを削除します。ここで、X はタグ名およびすべての属性を示します。関数は、開始タグと終了タグの間に出現するコンテンツを削除しません。たとえば、eraseTags("x<a>y</a>") は string "xy" を返します。タグ <a> とタグ </a> のみが削除されるのであり、要素 <a>y</a> が削除されるのではありません。

すべて折りたたむ

ある HTML コードからタグを消去します。関数はスペース付きで <br> タグを置き換えます。

htmlCode = "one.<br>two";
newStr = eraseTags(htmlCode)
newStr = 
"one. two"

ある XML コードからタグを消去します。関数は <sub> タグをスペースに置き換えることなく削除します。

xmlCode = "H<sub>2</sub>O";
newStr = eraseTags(xmlCode)
newStr = 
"H2O"

入力引数

すべて折りたたむ

入力テキスト。string 配列、文字ベクトル、または文字ベクトルの cell 配列として指定します。

例: ["An example of a short sentence."; "A second short sentence."]

データ型: string | char | cell

出力引数

すべて折りたたむ

出力テキスト。string 配列、文字ベクトル、または文字ベクトルの cell 配列として返されます。strnewStr は同じデータ型です。

バージョン履歴

R2017b で導入