批处理提取网页文本特定标签间的文字

批处理提取网页文本特定标签间的文字,第1张

因html 文件格式很杂乱,所以下面代码针对常见的来处理:

<title> 前面除了空格不能有其他字符;之间的字符不能含空格(如果有空格,将舍弃空格后面的部分)

@echo off

for /f "delims=" %%f in ('dir /b html') do (

for /f "skip=2 tokens=2 delims=<> " %%n in ('find /I "<title>" %%f') do (ren "%%f" "%%n"html))

一个思路:js或者选取事件,然后将选中的文字长度及该文字的doc层次结构及文字起始位置写到cookie里,下次访问时,从cookie中获取值再根据doc层次结构及起始位置在页面中查找到文字,并高亮。比如:<html><body><p><p><p>啊啊啊啊啊aaa变变变</p></body></html>,如果选中aaa,那么记录doc结构为html下body下第二个p,记录长度为3,记录起始位置为10(这里以一个汉字两个字符长度,具体只有保证存和取一致即可)。大概看了一下这个流程的js功能用jquery应该都可以实现。

如果前后的html代码固定的话,正则很简单

Match m = RegexMatch(html, @"<div id=""stream"" class=""message""><ol><li><span class=""content"">([^<])</span>", RegexOptionsIgnoreCase);

if(mSuccess){

ResponseWrite(mResult("$1"));

}

1、禁用网页脚本:将Internet的所有“脚本”都改为“禁用”,当复制到自己需要的内容后,再给网页脚本解禁,这样不会影响到我们浏览其他网页;

2、利用浏览器的编辑功能:只要在浏览器的工具栏点击“编辑工具”,就可以使用关联的文本编辑工具将网页内容复制其中,随后进行相关的编辑 *** 作。

以上就是关于批处理提取网页文本特定标签间的文字全部的内容,包括:批处理提取网页文本特定标签间的文字、如何获取网页中选中的文字位置、C#如何获取网页中指定文字信息比如饭否里手机给饭否发送的信息,如何获取并比对等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址:https://www.54852.com/web/9651070.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-04-30
下一篇2023-04-30

发表评论

登录后才能评论

评论列表(0条)

    保存