求助关于寻找文本的方法+帮我看下这个是什么加密方式

冰枫 · 发表于 2010-3-24 02:12:45

<div class="validate"><input type="hidden" name="identifier_from" value="0" /><input type="hidden" id="identifier" name="identifier" value="要取出的数字" />验证码：<input type="text" maxlength="4" id="auth_code" name="auth_code" onkeyup="this.value = this.value.toUpperCase();" /><img id="auth_code_img" src="http://passport.caihong.com/authCode.php?tag=要取出的数字" onclick="change_auth_code()" />看不清楚，<a href="#" onclick="change_auth_code();return false;">换张图片</a></div>
<div class="btn_area"><input type="image" src="http://img.caihong.com/reg/images/btn_3.jpg" name="next" value="下一步" /></div>

问题1：
以上一一段文本，如何取出文本里面的文本“要取出的数字”(这里我是举个例子)，我的意思是要取出来的这部分内容，位置是固定不变的，但每次要取出来的文本长度是不一样的，不太会用取文本中间这个命令，因为这段文本里面有很多的引号，我提取内容以后会跟取文本命令里面的引号混淆，所以不知道该如何处理，等待高手解答
问题2：
另外一个问题是关于加密问题的：
%2540===这个加密代码所代表的是@
%25E4%25B8%25AD%25E5%259B%25BD%25E4%25BA%25BA&====这个解密之后是：中国人
%25E6%2582%25A8%25E7%259A%2584%25E7%2594%25B5%25E8%25AF%259D%25E5%258F%25B7%25E7%25A0%2581&====这个解密之后是：您的电话号码
%25E6%2588%2591%25E7%259A%2584%25E7%2588%25B6%25E4%25BA%25B2%25E5%2590%258D%25E5%25AD%2597%25E6%2598%25AF&====这个解密之后是：我的父亲名字是
%25E6%2582%25A8%25E7%259A%2584%25E6%25AF%258D%25E4%25BA%25B2%25E5%2590%258D%25E5%25AD%2597%25E6%2598%25AF&====这个解密之后是：我的母亲名字是
%25E6%2588%2591%25E7%259A%2584%25E9%2585%258D%25E5%2581%25B6%25E5%2590%258D%25E5%25AD%2597%25E6%2598%25AF====这个解密之后是：我的配偶名字是
%25E6%2582%25A8%25E6%259C%2580%25E5%2596%259C%25E6%25AC%25A2%25E7%259A%2584%25E6%2598%258E%25E6%2598%259F%25E6%2598%25AF====这个解密之后是：您最喜欢的明星是
%25E6%2582%25A8%25E7%259A%2584%25E7%2588%25B6%25E4%25BA%25B2%25E7%2594%259F%25E6%2597%25A5%25E6%2598%25AF====这个解密之后是：您的父亲生日是

有没有高手看到过类似的加密方式，请教，是一般的加密还是个人特殊加密，有没有这类解密模块，请教

诸葛 · 发表于 2010-3-24 02:12:46

问题1：如果用寻找文本最笨的办法就是多取几次确定位置，肯定可以的，不要想着一步到位，往往会出错，尤其网页的变数，所以你就别嫌麻烦，我重点说说第二个问题

问题2：
%25E4%25B8%25AD%25E5%259B%25BD%25E4%25BA%25BA&====中国人

%25就是%的意思，可以直接替换去掉，剩下的字符每个汉字为三组十六进制，E4 B8 AD E5 9B BD E4 BA BA

ansi编码的十进制的汉字确实是两组十六进制，“中国人”应该是D6 D0 B9 FA C8 CB

utf8编码的十进制的汉字却是三组十六进制，“中国人”就成为了E4 B8 AD E5 9B BD E4 BA BA

所以这样的编码，你解码的顺序是：
1.先将%25E4%25B8%25AD%25E5%259B%25BD%25E4%25BA%25BA
替换为%E4%B8%AD%E5%9B%BD%E4%BA%BA，这个就是你经常见到的网页里的形式了

2.去掉所有百分号，转换为十进制文本

3.将转换完的文本从utf8转换为ansi

示例代码：
[e].版本 2
.支持库 spec

.局部变量 wb, 文本型
wb ＝子文本替换 (“%25E4%25B8%25AD%25E5%259B%25BD%25E4%25BA%25BA”, “%25”, “ ”, , , 真)
wb ＝取文本右边 (wb, 取文本长度 (wb) － 1)
调试输出 (wb)
wb ＝十六进制到文本 (wb)
wb ＝ UTF8转ANSI (到字节集 (wb))
调试输出 (wb)[/e]

调试输出的结果：

开始运行被调试程序
* “E4 B8 AD E5 9B BD E4 BA BA”
* “中国人 ”
被调试易程序运行完毕

我里面用到了模块的命令，模块你就自己找吧，回答完毕

huomu · 发表于 2010-3-24 08:14:44

楼上高手也…………

精易-小纯 · 发表于 2010-3-24 10:24:29

沙发那个确实是高手，，诸葛我真佩服你！！！有时间可以请教你吗？

冰枫 · 发表于 2010-3-24 12:32:38

呵呵，现在版主们真勤快，上午有事出去了，没来得急回复，都帮我选答案了，不过还是谢谢各位高手
然后再研究

冰枫 · 发表于 2010-3-24 12:37:42

不过不知道诸葛大哥还看不看我的回复了，对于第一个问题，
我有个问题：
比如说，用找中间文本的话，需要复制要找文本前面跟后面的一些代码，但这些代码中往往会包含一些原来网页中所用到的引号，如果放到寻找文本命令中时候，是文本型的，需要加双引号，但如果用了引号之后系统无法自己区分，如何区分呢

诸葛 · 发表于 2010-3-24 13:56:29

文本寻找的问题.e (3.36 KB, 下载次数: 13)

xusteven · 发表于 2010-5-21 01:38:44

高手，看了不得不顶。

小禹吉 · 发表于 2011-11-19 16:46:34

下载看看~~呵呵

		自动登录	找回密码
密码			注册

[已解决] 求助关于寻找文本的方法+帮我看下这个是什么加密方式

最佳答案

浏览过的版块