python爬虫怎么爬取父标签里子标签的内容

python爬虫怎么爬取父标签里子标签的内容,第1张

handle_starttag每遇见一个以"<"开始的tag回调一次,handle_endtag每遇见一个"</"标识的结束时回调一次,你的text3和text5位于结束标记之后,因此要自己手动用flag标记下,然后在handle_data里处理对应的数据!

int eventType = parsergetEventType();

while (eventType != XmlPullParserEND_DOCUMENT) {

switch (eventType) {

case XmlPullParserSTART_DOCUMENT://文档开始事件,可以进行数据初始化处理

break;

case XmlPullParserSTART_TAG://开始元素事件

String name = parsergetName();

if (nameequalsIgnoreCase("father")) {

//获取下一个文本信息

String sometext = parsernextText();

}

eventType = parsernext();

}

没有直接获取子元素在父元素的序号的方法,需要去循环比对的。

不过,你在循环设置className的时候可以直接把要控制div保存给要被点击的div呀,这样效率高得多

for(var i=0; i<first_length; i++){

first[i3]className='no_click'; //

first[i3]controlTo = second[i3] ;

second[i3]className='no_display';

}

这样first里面的div被点击,只要 被点击的divcontrolTo 就能得到对应的要显示的second组的标签了,非常方便,执行效率也很高。

比如 某个div被点, 只要

thclassName = "click" ;

thcontrolToclassName = "display" 即可 ;

以上就是关于python爬虫怎么爬取父标签里子标签的内容全部的内容,包括:python爬虫怎么爬取父标签里子标签的内容、android 用Pull 方式解析XML时,父标签与子标签之间的文本要如何获取 如图中的sometext要怎么获取、(HTML JS javascript) js 中如何得到本标签位于父标签中的第几个等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址:https://www.54852.com/web/9348751.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-04-27
下一篇2023-04-27

发表评论

登录后才能评论

评论列表(0条)

    保存