本帖最后由 宇智波·佐助 于 2017-6-12 10:51 编辑
视频教程:
从这节课开始,各位同学们将和我一起开启学习的新篇章!
我们来学习什么呢?我们来一起学习一个变态而强大的东西——正则表达式。
那么正则表达式是个什么鬼呢? 来我们先来看一下正则表达式的定义: “正则表达式,英文名叫做Regular Expression,也可以简写为regex,re等,是一条按某个规则匹配或替换文本字符串的式子。” 我们或许在系统的搜索中使用过*等通配符来匹配文件名,而正则表达式会比这个更复杂但更强大。
学习正则表达式有什么用呢? - 装逼,因为它的复杂性,一旦掌握,叱咤风云,能解决常人不能解决的问题。我可以负责任的保证,学好它你会觉得你自己玩的东西都高端了许多,因为它的强大,汉子学了可以从来泡妹子,妹子可以用来泡汉子,帮人解决困难嘛,人家会觉得天哪你竟然只用了一条式子就可以把我好多个小时的手动操作的痛苦给解决了,接下来,你就自己看着办。
- 巨量文本内容取出,批量替换等,包括文本类型文件(txt,doc等)以及网页源代码,我个人接触的更多的是从互联网获取信息,采集信息,毕竟现在是信息时代嘛,网上的信息比比皆是,也可以说是一个大数据为王的时代来临,可以预见,未来工作中,各个公司对于大数据的依赖性会多么强烈,而你掌握了从互联网批量获取数据又不花费什么力气的强大技能,好工作还不是任你挑选?
- 可用性广,许多应用软件(比如word,notepad++),许多编程语言(比如python,易语言,C,C++,Java,VB)等都支持正则表达式,学好一个,到任何语言中可以直接使用。正则表达式是一种全球通用的表达语言,各种各样的文本编辑软件(当然除了系统自带的记事本之外),各种各样的编程语言都可以支持的。而文本编辑领域优势大家一定会触碰和用到的,不管是在工作中还是在生活中,因此正则表达式可以说适合所有想学习它的朋友学习,不仅仅是只适合编程人士学习。因此请不要吝啬,不要腼腆!只要你想学习它,所有人学习它都会非常非常的有用!因为我个人为此获得了巨大的回报,因此跟着我雪山凌狐好好的学习正则表达式绝对不亏!更何况,全套教程完全免费!欢迎觉得好的朋友今后多多宣传我的教程。
有的同学可能听我说正则表达式挺复杂的,可能怕看不懂,在这里我要说: 跟我学,So easy!
我们现在就开始!让我们先来看点正则表达式的实战例子,让大家有一点学习的动力! 我个人把正则表达式的应用分为两类,一类是在文本内容文件中的正则匹配,另一种是在网上,网页源代码中进行正则匹配。 1. 小说章节匹配 其中一种应用,是在极大的内容文本中匹配到自己想要的内容,比如一本小说。
以上是我挺喜欢的一本小说——校花的贴身高手(顺便吐槽一下鱼人更了好多年都没更完)。比如这里,我们需要把整本小说的章节序号和标题取出,进行后续的操作,我们就只需要写一条正则匹配式子就可以实现了!非常的方便!当然啦,式子看不懂没关系,这不是重点。
另外的大多数都应用在从网页源代码中取出内容,我们的教程也重点着眼于此。 2. 七星彩网站开奖信息采集
好,比如这个网站可以发布七星彩的开奖时间,期号和开奖号码等,总共有好几十页,我们只需要一条正则式子,即可或许到目前1977条数据。之后数据怎么处理,就可以看你的了。 3. 表情包下载地址获取
比如我找到一个很不错的表情包网站。网站本身提供的下载功能是只能下载一个QQ表情包安装文件,而不是下下来就是图片文件,而且这里一整套表情包总共有67页,可以从最后一幅图看到有2249个表情,按照手动的做法,你得手动右键图片另存为,这样的操作,你得做2249次,想想是不是都要疯掉了。我是个懒人,当然不可能这么干,看看第二幅图的网页源码,可以在里面找到图片的地址的,写个软件,用一条正则表达式,把两千多的下载地址匹配出来,再批量下载不就好了嘛。 4. 论坛帖子板块监控
应该大部分同学都去过一些论坛,不同的论坛长相不同,但是既然是论坛,就是各种帖子充斥嘛。拿易辅客栈的论坛来举栗子,论坛有很多的帖子,管理员们都是怎么去管理每天大量的帖子的呢?登录论坛手动管理?别傻了,管理员们都是聪明的主,他们会写一个论坛板块监控软件,使用正则把这个页面的所有帖子标题以及对应的地址匹配出来,比如软件监控到标题中含有违禁的主题,甚至直接可以在软件中进行帖子的删除或者修改操作。对帖子内容的监控也同理。 5. 股票日交易数据获取
做金融数据分析的同学,看到这个应该比较熟悉,通过一条正则表达式,可以把股票从上市到最新交易日的所有交易数据取出,比如这里中国平安我们能获取到两千多个交易日的所有数据。之后对这个数据进行量化投资分析,保存到本地进行其他分析或者别的处理就随你了。
关于正则表达式的例子还有很多很多,我们仅仅作为开头,学好本套教程,你也可以写出这样的表达式和软件! 请明白,学好正则表达式你能干的事情是只需要用一行的一条式子就可以把成千上万符合规则的内容取出,可以保存本地数据库,也可以进行批量替换!
好了,关于正则表达式的背景知识介绍就到这里,我们下一节课将给大家推荐一些正则表达式练习和测试的小软件,敬请期待!
高清源文件下载: 链接:http://pan.baidu.com/s/1jIbWFgq 密码:2iar 下载:https://share.weiyun.com/37f1d76dbf7376c42f3719fbc800007e
第2课地址: 暂未发布请耐心等待。
|