变量名 | 类 型 | 静态 | 数组 | 备 注 | url_all | 文本型 | | 0 | i | 整数型 | | | 电影名 | 文本型 | | | fputs (1, “开始获取...” + #换行符 )取全部详情页链接 (“https://movie.douban.com/top250”, url_all ). for (1, GetAryElementCount (url_all ), 1, i )fputs (1, url_all [i ] + #换行符 )取影片信息 (url_all [i ]). next ()fputs (1, “获取完成!” + #换行符 )fgets ()return (0 ) |
取全部详情页链接 | 整数型 | | |
url | 文本型 | | | | url_all | 文本型 | | | |
变量名 | 类 型 | 静态 | 数组 | 备 注 | html_str | 文本型 | | | grid_view_str | 文本型 | | | url_arr | 文本型 | | 0 | i | 整数型 | | | page | 整数型 | | | full_url | 文本型 | | |
. for (1, 250, 25, page ) full_url = url + “?start=” + str (page )html_str = HttpRequestRetText (url, 0, , , , , , , , , )html_str = Utf8ToGb2312 (html_str ) grid_view_str = GetMidText (html_str, #left_grid_view, #right_grid_view, , )GetMidText_批量 (grid_view_str, #left_a, #right_a, url_arr, , , , , , , ). for (1, GetAryElementCount (url_arr ), 1, i )AddElement (url_all, url_arr [i ]). next (). next ()return (0 )变量名 | 类 型 | 静态 | 数组 | 备 注 | html_str | 文本型 | | | 电影名 | 文本型 | | | 年份 | 文本型 | | | 导演 | 文本型 | | | attrs_html | 文本型 | | | 主演数组 | 文本型 | | 0 | i | 整数型 | | | 类型数组 | 文本型 | | 0 | 地区 | 文本型 | | | 语言 | 文本型 | | | 评分 | 文本型 | | |
html_str = HttpRequestRetText (url, 0, , , , , , , , , )html_str = Utf8ToGb2312 (html_str )电影名 = GetMidText (html_str, #left_电影名, #right_电影名, , )年份 = GetMidText (html_str, #left_年份, #right_年份, , )导演 = GetMidText (html_str, #left_导演, #right_导演, , ) GetMidText_批量 (html_str, #left_主演, #right_主演, 主演数组, , , , , , , ) GetMidText_批量 (html_str, #left_类型, #right_类型, 类型数组, , , , , , , )地区 = GetMidText (html_str, #left_地区, #right_地区, , )语言 = GetMidText (html_str, #left_语言, #right_语言, , )评分 = GetMidText (html_str, #left_评分, #right_评分, , ) fputs (1, “电影名:” + 电影名 + #换行符 )fputs (1, “年份:” + 年份 + #换行符 )fputs (1, “导演:” + 导演 + #换行符 )fputs (1, “主演:”). for (1, GetAryElementCount (主演数组 ), 1, i ). ife (i < 3 )fputs (1, 主演数组 [i ] + “/”) break () . next ()fputs (1, #换行符 )fputs (1, “类型:”). for (1, GetAryElementCount (类型数组 ), 1, i ). ife (i < 3 )fputs (1, 类型数组 [i ] + “/”) break () . next ()fputs (1, #换行符 )fputs (1, “地区:” + 地区 + #换行符 )fputs (1, “语言:” + 语言 + #换行符 )fputs (1, “评分:” + 评分 + #换行符 )fputs (1, #换行符 )
爬取豆瓣top250.rar
(353.28 KB, 下载次数: 22)
|