ruby on rails正则表达式用于从文本中删除html标记及其内容

hujrc8aj  于 2022-11-04  发布在  Ruby
关注(0)|答案(3)|浏览(172)

我想在ruby的正则表达式在轨道上删除所有的html标签和它的内容从给定的文本。
例如,如果我的文本是:-INPUT:-

<span id="span_is"><br><br><u><i>Hi</i></u></span>

则应仅显示OUTPUT,如下所示:-

Hi

简而言之,我想要一个正则表达式或函数,它删除〈〉和〈〉之间的任何内容。
感谢并致以问候,
萨利勒·盖夸德

vom3gejh

vom3gejh1#

'<span id="span_is"><br><br><u><i>Hi</i></u></span>'.gsub(/<\/?[^>]+>/, '')
rbpvctlc

rbpvctlc2#

你的字符串非常简单,这个解决方案 * 可能 * 会起作用。但是,你不应该重新发明轮子。Rails已经包含了一些功能强大的sanitization helpers

string = '<span id="span_is"><br><br><u><i>Hi</i></u></span>'
strip_tags(string)
kmbjn2e3

kmbjn2e33#

别这样,求你了.
虽然您的示例输入相当琐碎,但您提到您希望在更广泛的范围内使用它。
http://www.codinghorror.com/blog/2009/11/parsing-html-the-cthulhu-way.html
对于Ruby,您可以尝试使用http://hpricot.com/来解析HTML。

相关问题