开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 26749|回复: 1
收起左侧

[源码分享] Python实例记录----TXT文本文件储存

[复制链接]
结帖率:50% (3/6)
发表于 2022-3-1 21:51:54 | 显示全部楼层 |阅读模式   河北省邢台市
[Python] 纯文本查看 复制代码
import requests
from pyquery import PyQuery as pq
import re

url = 'https://ssr1.scrape.center/'
html = requests.get(url).text
doc = pq(html)  # 初始化
items = doc('.el-card').items()
# 字典 items() 方法以列表返回视图对象,是一个可遍历的对象 只读不可修改 不是列表,不支持索引,可以使用 list() 来转换为列表

file = open('movies.txt', 'w', encoding='utf-8')
'''
'w'每次写入文本时都会清空原有文件,将新的写入 wb w+ wb+ 都会覆盖已有文件或创建新文件
'a'追加方式打开,不会覆盖原文件,若无会创建 ab二进制写入  a+读写 ab+二进制读写
'r'只能读取不能写入
'rb'以二进制只读方式打开一个文件,例如音频,视频,图片
'r+'可读可写
'rb+'可读可写二进制文件
'''
for item in items:
    # print(item)

    # 电影名称
    name = item.find('a>h2').text()  # 查找a标签下h2标签内容
    file.write(f'名称:{name}\n')  # 写入换行
    # 类别
    
    
    categories = [item.text() for item in item.find('.categories button span').items()]
    
    
    file.write(f'类别:{categories}\n')
    # 上映时间
    publishend_at = item.find('.info:contains(上映)').text()  # .info:contains(上映)  获取.info下带有”上映“的内容
    publishend_at = re.search('(\d{4}-\d{2}-\d{2})', publishend_at).group(1) if publishend_at and re.search(
        '(\d{4}-\d{2}-\d{2})', publishend_at) else None
    file.write(f'上映时间:{publishend_at}\n')
    # 评分
    score = item.find('p.score').text()
    file.write(f'评分:{score}\n')
    file.write(f'{"=" * 50}\n')
file.close()

结帖率:98% (54/55)
发表于 2022-3-2 23:44:24 | 显示全部楼层   湖北省天门市
楼主,这个是干啥用啊
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 793400750,邮箱:wp@125.la
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表