开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 510|回复: 8
收起左侧

[已解决] py xpath 定位取值求教

 关闭 [复制链接]
结帖率:94% (80/85)
发表于 2022-11-16 13:51:23 | 显示全部楼层 |阅读模式   重庆市重庆市
66精币
网页代码下如:

<tbody>
<tr><td style="height: 0.01px; width: 364px;"></td><td style="height: 0.01px; width: 364px;"></td><td style="height: 0.01px; width: 362px;"></td></tr>
<tr ><td title="类型一" >类型一</td><td title="标题一">标题一</td><td title="型号一">型号一</td></tr>
<tr ><td title="类型二" >类型</td><td title="标题二">标题二</td><td title="型号二">型号二</td></tr>
<tr><td title="类型三" >类型</td><td title="标题三">标题三</td><td title="型号三">型号三</td></tr>
<tr><td title="类型二" >类型</td><td title="标题四">标题四</td><td title="型号四">型号四</td></tr>
<tr><td title="类型三" >类型</td><td title="标题五">标题五</td><td title="型号五">型号五</td></tr>
……
</tbody></table>
</div>
求教:分别获取:所有:类型二:后面的:标题和型号,希望能给出:用正则,和不用正则的方式。
谢谢。




补充内容 (2022-11-16 13:54):
并根据:型号四,匹配出:标题四,的内容。

最佳答案

查看完整内容

[mw_shl_code=python,true]import os, traceback from lxml import etree text = ''' 类型一标题一型号一 类型标题二型号二 类型标题三型号三 类型标题四型号四 类型标题五型号五 ''' html = etree.HTML(text) s = etree.tostring(html).decode() html_data = html.xpath('/html/body/tbody/tr') for i in html_data: #print(i.xpath('td/@title')) if(len(i.xpath('td/@title'))>0 and i.xpath('td/@title')[0]==' ...

回答提醒:如果本帖被关闭无法回复,您有更好的答案帮助楼主解决,请发表至 源码区 可获得加分喔。
友情提醒:本版被采纳的主题可在 申请荣誉值 页面申请荣誉值,获得 1点 荣誉值,荣誉值可兑换荣誉会员、终身vip用户组。
快捷通道:申请荣誉值无答案申请取消悬赏投诉有答案未采纳为最佳

结帖率:100% (1/1)

签到天数: 22 天

发表于 2022-11-16 13:51:24 | 显示全部楼层   河南省郑州市
[Python] 纯文本查看 复制代码
import os, traceback

from lxml import etree

text = '''
<tbody>
<tr><td style="height: 0.01px; width: 364px;"></td><td style="height: 0.01px; width: 364px;"></td><td style="height: 0.01px; width: 362px;"></td></tr>
<tr ><td title="类型一" >类型一</td><td title="标题一">标题一</td><td title="型号一">型号一</td></tr>
<tr ><td title="类型二" >类型</td><td title="标题二">标题二</td><td title="型号二">型号二</td></tr>
<tr><td title="类型三" >类型</td><td title="标题三">标题三</td><td title="型号三">型号三</td></tr>
<tr><td title="类型二" >类型</td><td title="标题四">标题四</td><td title="型号四">型号四</td></tr>
<tr><td title="类型三" >类型</td><td title="标题五">标题五</td><td title="型号五">型号五</td></tr>
</tbody>
'''
html = etree.HTML(text)
s = etree.tostring(html).decode()

html_data = html.xpath('/html/body/tbody/tr')
for i in html_data:
    #print(i.xpath('td/@title'))
    if(len(i.xpath('td/@title'))>0 and i.xpath('td/@title')[0]=='类型二'):
        print(i.xpath('td/@title'))

评分

参与人数 2好评 +1 精币 +3 荣誉 +1 收起 理由
项目部004 + 1 热心帮助他人,荣誉+1,希望继续努力(*^__^*) 嘻嘻!
Z隐 + 1 + 3 YYDS~!

查看全部评分

回复

使用道具 举报

签到天数: 25 天

发表于 2022-11-16 14:16:49 | 显示全部楼层   河北省保定市
汉化过py selenium一部分 这里建议发网址看
回复

使用道具 举报

结帖率:94% (80/85)

签到天数: 25 天

 楼主| 发表于 2022-11-16 14:32:03 | 显示全部楼层   重庆市重庆市
钢铁璐lu 发表于 2022-11-16 14:16
汉化过py selenium一部分 这里建议发网址看

不好意思,网址在nei网上的,麻烦大佬指点一下,
我自己能定位取出第一条,望指点如何简洁地取出所有符合第一条件的内容,进行对比取出第二条件的结果
回复

使用道具 举报

签到天数: 25 天

发表于 2022-11-16 14:41:57 | 显示全部楼层   河北省保定市
Z隐 发表于 2022-11-16 14:32
不好意思,网址在nei网上的,麻烦大佬指点一下,
我自己能定位取出第一条,望指点如何简洁地取出所有符合 ...

那指教不了 等别人
回复

使用道具 举报

结帖率:100% (1/1)

签到天数: 22 天

发表于 2022-11-16 15:07:09 | 显示全部楼层   河南省郑州市
正则
title="类型二".*?="(.*?)".*?="(.*?)"

补充内容 (2022-11-16 15:11):
<tr>[^=]+=[^=]+="(.*?)"[^=]+="型号四"
回复

使用道具 举报

结帖率:33% (1/3)
发表于 2022-11-16 15:36:31 | 显示全部楼层   广西壮族自治区南宁市
'//td[@title="类型二"]/following-sibling::td'  返回元素的数组, 0和1的text分别是第一组的标题和型号。2,3是第二组的标题和型号
回复

使用道具 举报

结帖率:33% (1/3)
发表于 2022-11-16 15:44:57 | 显示全部楼层   广西壮族自治区南宁市
补充内容的:  '//td[@title="型号四"]/preceding-sibling::td[1]'  , 返回元素数组,只有一个元素,它的text就是标题四

评分

参与人数 1精币 +3 收起 理由
Z隐 + 3 感谢帮助,小小心意,望不嫌弃

查看全部评分

回复

使用道具 举报

结帖率:33% (1/3)
发表于 2022-11-16 15:46:17 | 显示全部楼层   广西壮族自治区南宁市
使用正则的方法还不太懂,最后是使用contains函数
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 诚聘英才| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 800073686,邮箱:800073686@b.qq.com
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表