我想在ruby的正则表达式在轨道上删除所有的html标签和它的内容从给定的文本。例如,如果我的文本是:-INPUT:-
<span id="span_is"><br><br><u><i>Hi</i></u></span>
则应仅显示OUTPUT,如下所示:-
Hi
简而言之,我想要一个正则表达式或函数,它删除〈〉和〈〉之间的任何内容。感谢并致以问候,萨利勒·盖夸德
vom3gejh1#
'<span id="span_is"><br><br><u><i>Hi</i></u></span>'.gsub(/<\/?[^>]+>/, '')
rbpvctlc2#
你的字符串非常简单,这个解决方案 * 可能 * 会起作用。但是,你不应该重新发明轮子。Rails已经包含了一些功能强大的sanitization helpers。
string = '<span id="span_is"><br><br><u><i>Hi</i></u></span>' strip_tags(string)
kmbjn2e33#
别这样,求你了.虽然您的示例输入相当琐碎,但您提到您希望在更广泛的范围内使用它。http://www.codinghorror.com/blog/2009/11/parsing-html-the-cthulhu-way.html对于Ruby,您可以尝试使用http://hpricot.com/来解析HTML。
3条答案
按热度按时间vom3gejh1#
rbpvctlc2#
你的字符串非常简单,这个解决方案 * 可能 * 会起作用。但是,你不应该重新发明轮子。Rails已经包含了一些功能强大的sanitization helpers。
kmbjn2e33#
别这样,求你了.
虽然您的示例输入相当琐碎,但您提到您希望在更广泛的范围内使用它。
http://www.codinghorror.com/blog/2009/11/parsing-html-the-cthulhu-way.html
对于Ruby,您可以尝试使用http://hpricot.com/来解析HTML。