开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 3072|回复: 6
收起左侧

[易源码分享] elalr 语法分析代码&正则生成器(将正则编译成易语言)

[复制链接]
结帖率:50% (1/2)
发表于 2020-8-21 13:58:07 | 显示全部楼层 |阅读模式   河南省商丘市
分享源码
界面截图: -
是否带模块: -
备注说明: -
这是一段识别gbk中文和英文的标识符正则表达式
([a-zA-Z_]|[\x81-\xfe][\x40-\xfe])([a-zA-Z0-9_]|[\x81-\xfe][\x40-\xfe])*
原理是通过正则表达式的AST直接构造DFA自动机

编译成易语言结果为
  
子程序名返回值类型公开备 注
RegexMatch整数型 
参数名类 型参考可空数组备 注
代码文本型
代码位置整数型
变量名类 型静态数组备 注
最后符号整数型 
最后位置整数型 
状态整数型 
读入整数型 
读入 = 0
状态 = 0
最后符号 = 0
最后位置 = 代码位置
循环判断首 ()
读入 = 到字节 (取代码 (代码, 代码位置))
代码位置 = 代码位置 + 1
如果真 (状态 = 0)
如果真 (读入 ≥ 65 读入 ≤ 90)
状态 = 1
到循环尾 ()
如果真 (读入 ≥ 95 读入 ≤ 95)
状态 = 1
到循环尾 ()
如果真 (读入 ≥ 97 读入 ≤ 122)
状态 = 1
到循环尾 ()
如果真 (读入 ≥ 129 读入 ≤ 254)
状态 = 2
到循环尾 ()
跳出循环 ()
如果真 (状态 = 1)
最后位置 = 代码位置
最后符号 = 1
如果真 (读入 ≥ 48 读入 ≤ 57)
状态 = 1
到循环尾 ()
如果真 (读入 ≥ 65 读入 ≤ 90)
状态 = 1
到循环尾 ()
如果真 (读入 ≥ 95 读入 ≤ 95)
状态 = 1
到循环尾 ()
如果真 (读入 ≥ 97 读入 ≤ 122)
状态 = 1
到循环尾 ()
如果真 (读入 ≥ 129 读入 ≤ 254)
状态 = 3
到循环尾 ()
跳出循环 ()
如果真 (状态 = 2)
如果真 (读入 ≥ 64 读入 ≤ 254)
状态 = 1
到循环尾 ()
跳出循环 ()
如果真 (状态 = 3)
如果真 (读入 ≥ 64 读入 ≤ 254)
状态 = 1
到循环尾 ()
跳出循环 ()

循环判断尾 ()
代码位置 = 最后位置 - 1
返回 (最后符号)


下面是elalr解析形如 add(1, add(...) , ...) + (12*4) *4 这样的表达式的文法
通过这样的文法 LALR(1)可以描述几乎所有的CFG文法 也就是说可以解析 HTML JSON XML C/C++ JAVA 基本上所有的语言 网上也有很多他们的文法 可以比着写一下
%左结合 '+' '-' '*' '/'; //定义优先级与结合性

%开始符 表达式; // 这句的意思是 文法的开始就是 '表达式'

表达式 -> 表达式 '+' 表达式  [表达式_相加] |  // 这是表达式的5个产生式 也就是说表达式可以用5种格式组成 [] 中包括的内容就是遇到这个形式的产生式将会调用什么子程序
               表达式 '-' 表达式   [表达式_相减] |
               表达式 '*' 表达式  [表达式_相乘] |
               表达式 '/' 表达式  [表达式_相除] |
               '(' 表达式 ')'         [表达式_括号] ;

表达式 -> 数字 | 函数调用 ; // 这里是表达式的另外两个产生式 表达式可以是函数调用 也可以是数字

数字 -> "[0-9]+" [表达式_值] ;

函数调用 -> 标识符 '(' 参数列表 ')' [表达式_函数调用] ; // 函数调用的产生式 用来表述函数调用的形式

参数列表 -> 参数列表 ',' 表达式 [参数表_加入] |  // 这个产生式是左递归的 只要后面出现 ',' 就会调用 参数表_加入 向数据中加入后面的表达式
                  表达式 [参数表_创建] ;

标识符 -> "([a-zA-Z_]|[\x81-\xfe][\x40-\xfe])([a-zA-Z0-9_]|[\x81-\xfe][\x40-\xfe])*"; // 中文标识符


%无结合 为没有结合性但会定义优先级
%左结合 为左结合性以及定义优先级
%右结合 为左结合性以及定义优先级



'xxx' 单引号包裹的是 文本字面量 如 'if' 注意:内含转义
"xxx" 双引号包裹的是正则表达式
bracket
支持的正则语法比较简单 但也可以描述大部分正则了 不支持negative bracket
() . * + ? []
Elalr.zip (41.14 KB, 下载次数: 39)

评分

参与人数 3好评 +3 精币 +10 收起 理由
易语言资源网 + 1 + 3 支持开源~!感谢分享
18318141417 + 1 + 2 新技能已get√
冰点 + 1 + 5 支持开源~!感谢分享

查看全部评分


结帖率:0% (0/1)

签到天数: 12 天

发表于 2022-2-17 18:18:13 | 显示全部楼层   河南省洛阳市

支持一下
回复 支持 反对

使用道具 举报

签到天数: 7 天

发表于 2021-10-17 09:08:16 | 显示全部楼层   江苏省泰州市
支持学习一下,感谢分享
回复 支持 反对

使用道具 举报

结帖率:64% (7/11)

签到天数: 20 天

发表于 2020-9-24 10:26:08 | 显示全部楼层   贵州省贵阳市
回复 支持 反对

使用道具 举报

签到天数: 6 天

发表于 2020-8-26 15:03:03 | 显示全部楼层   内蒙古自治区赤峰市
支持学习一下,感谢分享
回复 支持 反对

使用道具 举报

结帖率:87% (20/23)

签到天数: 1 天

发表于 2020-8-21 17:57:06 | 显示全部楼层   广东省东莞市
支持楼主开源  
回复 支持 反对

使用道具 举报

结帖率:72% (13/18)

签到天数: 12 天

发表于 2020-8-21 15:06:44 | 显示全部楼层   海南省海口市
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 793400750,邮箱:wp@125.la
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表