ruby-on-rails – 如何在Nokogiri的HTML代码中找到电子邮件地址?

ruby-on-rails – 如何在Nokogiri的HTML代码中找到电子邮件地址?,第1张

概述如何在Nokogiri的 HTML代码中找到电子邮件地址? 我想我需要使用正则表达式,但不知道如何. 示例代码 <html> <title>Example</title> <body> This is an example text. example@example.com </body> </html> 当有一个关于mail_to的href时,有一 如何在Nokogiri的 HTML代码中找到电子邮件地址?
我想我需要使用正则表达式,但不知道如何.

示例代码

<HTML>    <Title>Example</Title>    <body>    This is an example text.    example@example.com    </body>    </HTML>

当有一个关于mail_to的href时,有一个答案覆盖案例,但这不是我的情况.电子邮件地址有时位于链接中,但并非总是如此.

谢谢

解决方法 如果你只是试图从一个恰好是HTML的字符串中解析电子邮件地址,那么就不需要Nokogiri.

HTML_string   = "Your HTML here..."email_address = HTML_string.match(/[A-Z0-9._%+-]+@[A-Z0-9.-]+\.[A-Z]{2,4}/i)[0]

这不是一个完美的解决方案,因为构成“有效”电子邮件地址的RFC非常宽松.这意味着您遇到的大多数正则表达式(包括上面的表达式)都不考虑边缘情况有效地址.例如,根据RFC

$A12345@example.com

是一个有效的电子邮件地址,但不会与上面的正则表达式匹配.

>推荐阅读:http://haacked.com/archive/2007/08/21/i-knew-how-to-validate-an-email-address-until-i.aspx
>正则表达式来源:http://www.dzone.com/snippets/ruby-method-extract-emails

总结

以上是内存溢出为你收集整理的ruby-on-rails – 如何在Nokogiri的HTML代码中找到电子邮件地址?全部内容,希望文章能够帮你解决ruby-on-rails – 如何在Nokogiri的HTML代码中找到电子邮件地址?所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址:https://www.54852.com/langs/1222018.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2022-06-05
下一篇2022-06-05

发表评论

登录后才能评论

评论列表(0条)

    保存