免费python学习推荐视频: http://edu.51cto.com/course/course_id-1386.html
今天有个想法,想查询所有短域名是否被注册了,a-z1-9组成的所有3,4位组合的.com域名是否有没被注册的,于是开干,google后知道万网提供一个api可以查询, http://panda.www.net.cn/cgi-bin/check.cgi?area_domain=google.com, 后面的google.com可以换做你想查询的域名,结果会返回一个xml页面,如下
<?xml version="1.0" encoding="gb2312"?>
<property>
<returncode>200</returncode>
<key>google.com</key>
<original>211 : Domain name is not available</original>
</property>
上面的是域名已经被注册的返回页面,下面的是域名未被注册的页面,代码分别是211,210
<?xml version="1.0" encoding="gb2312"?>
<property>
<returncode>200</returncode>
<key>googleloveyou.com</key>
<original>210 : Domain name is available</original>
</property>
域名查询api有了,于是想办法解决如何生成所有 字母和数字 组成的3,4,5位组合,这是难点,生成所有3位组合,大家很容易解决,但是生成3,4,5位的貌似有点犯难了, google一下没获得好的信息,于是自己画图,自己想,和朋友求思路,最后终于解决了,思路是 用数字代替字母,
如 string = "abcdefghijklmnopqrstuvwxyz1234567890"
到时生成的4位域名组合为 aaaa aaab aaac aaad .... aaba aabb ... ...abaa abab等,转化成数字分别为 0000 0001 0002 0003 .... 0010 0011 ... ... 0100 0101 这些数字代表的是string的index,当数字为字母长度时,上一位数字+1,最后将数字列表转换成字母列表即可,脚本如下:
#!/usr/bin/python
# coding: utf-8
# author: GuangHongwei
# date: 2014/7/28
# mail:
import time
import urllib
import re
api = "http://panda.www.net.cn/cgi-bin/check.cgi?area_domain=%s" # api地址
string = "abcdefghijklmnopqrstuvwxyz1234567890" # 所有字母
string_len = len(string) # 长度
fname = 'name.txt' # 还没被注册的域名写入该文件
suffix = '.com' # 域名后缀
domain_lenth_range = range(3, 5) # 字母组合的长度,3到5但不包括5
def min(num):
"""初始化第一个值数字列表"""
name = []
for i in range(num):
name.append(0)
return name
def max(num, max_num):
"""返回最大的值数字列表"""
name = []
for i in range(num):
name.append(max_num)
return name
def num_2_string(name, string):
"""将数字列表转化为字母组合列表"""
new_name = []
for i in name:
new_name.append(string[i])
return ''.join(new_name)
def is_ava(domain):
"""判断该域名是否被注册"""
data = urllib.urlopen(api % domain).read()
ava_pattern = re.compile(r'<original>(.*) : .*</original>')
perm_pattern = re.compile(r'Forbidden')
result = ava_pattern.findall(data)
if '210' in result:
print '%s ---------> Ok' % domain
return True
elif '211' in result:
print '%s ---------> No' % domain
return False
else:
print 'Forbidden'
return False
def domain_name(num):
"""域名组合生成器"""
name = min(num)
last = max(num, string_len-1)
while True:
yield num_2_string(name, string)
if name == last:
break
name[num-1] += 1
while string_len in name:
index = name.index(string_len)
name[index] = 0
name[index-1] += 1
def run(domain_lenth):
"""执行,如果每被注册就写到文件中"""
f = open(fname, 'a')
for domain in domain_name(domain_lenth):
domain += suffix
if is_ava(domain):
f.write('%s\n' % domain)
f.flush()
time.sleep(0.5)
if __name__ == '__main__':
"""最终执行, 循环执行每种长度组合"""
for i in domain_lenth_range:
run(i)
脚本可以通过附件下载,直接运行即可,结果如下
wKioL1PVwSegbm3OAAGvRXS6dG0334.jpg
最后,由于万网的api,查询过于频繁,时间间隔太短,很快就会被封ip的,注意些。
附件:http://down.51cto.com/data/2364684
©著作权归作者所有:来自51CTO博客作者老广的原创作品,如需转载,请注明出处,否则将追究法律责任
共同學習,寫下你的評論
評論加載中...
作者其他優質文章