python 2

URL的格式

其实URL是有格式的。比如http://www.bupt.edu.cn/content/content.php?p=81_15_2417
scheme是http
username没有
password也省略了
host是www.bupt.edu.ch
port省略了,默认80
path是/content/content.php
query是p=81_15_2417
fragment没有

比如https://foo:bar@www.example.com:8080/abc/def/ghi?jkl=mno&pqr=stu#vwxyz
scheme是https
username是foo
password是bar
host是www.example.com
port是8080
path是/abc/def/ghi
query是jkl=mno&pqr=stu
fragment是vwxyz

多线程

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
from threading import Thread
from Queue import Queue
from time import sleep
#q是任务队列
#NUM是并发线程总数
#JOBS是有多少任务
q = Queue()
NUM = 2
JOBS = 10
#具体的处理函数,负责处理单个任务
def do_somthing_using(arguments):
print arguments
#这个是工作进程,负责不断从队列取数据并处理
def working():
while True:
arguments = q.get()
do_somthing_using(arguments)
sleep(1)
q.task_done()
#fork NUM个线程等待队列
for i in range(NUM):
t = Thread(target=working)
t.setDaemon(True)
t.start()
#把JOBS排入队列
for i in range(JOBS):
q.put(i)
#等待所有JOBS完成
q.join()