文章

Python练习-分布式任务

本部分练习Python分布式任务。在Python的multiprocessing模块中,提供了BaseManager类,可以非常简单快速的创建分布式调度任务。

思想也很简单,服务端开启端口,注册信息传递的队列,接收端链接对应地址和端口,拿到队列,获取其中传递的信息,进行对应处理即可。 如果有结果传回,可以在注册一个队列用于传递结果即可。样例代码如下:

服务端

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
# 分布实任务样例
import random, time, queue
from multiprocessing.managers import BaseManager

# 发送任务的队列:
work_queue = queue.Queue()
# 接收结果的队列:
result_queue = queue.Queue()


# 从BaseManager继承的QueueManager:
class QueueManager(BaseManager):
    pass


def workqueue():
    return work_queue


def resultqueue():
    return result_queue


# 把两个Queue都注册到网络上, callable参数关联了Queue对象:
QueueManager.register('get_work_queue', callable=workqueue)
QueueManager.register('get_result_queue', callable=resultqueue)

if __name__ == '__main__':
    # 绑定端口9000, 设置验证码'abcdefg':
    manager = QueueManager(address=('127.0.0.1', 9000), authkey=b'abcdefg')
    # 启动Queue:
    manager.start()
    # 获得通过网络访问的Queue对象:
    task = manager.get_work_queue()
    result = manager.get_result_queue()
    # 放几个任务进去:
    for i in range(10):
        n = random.randint(0, 10000)
        print('Put task %d: %d...' % (i, n))
        task.put(n)
    # 从result队列读取结果:
    print('Try get results...')
    for i in range(10):
        r = result.get(timeout=10)
        print('Result for task %s: %s' % (i, r))
    # 关闭:
    manager.shutdown()
    print('master exit.')

接收端

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
# task_worker.py

import time, sys, queue
from multiprocessing.managers import BaseManager


# 创建类似的QueueManager:
class QueueManager(BaseManager):
    pass


# 由于这个QueueManager只从网络上获取Queue,所以注册时只提供名字:
QueueManager.register('get_work_queue')
QueueManager.register('get_result_queue')

if __name__ == '__main__':
    # 连接到服务器,也就是运行task_master.py的机器:
    server_addr = '127.0.0.1'
    print('Connect to server %s...' % server_addr)
    # 端口和验证码注意保持与task_master.py设置的完全一致:
    m = QueueManager(address=(server_addr, 9000), authkey=b'abcdefg')
    # 从网络连接:
    m.connect()
    # 获取Queue的对象:
    task = m.get_work_queue()
    result = m.get_result_queue()
    # 从task队列取任务,并把结果写入result队列:
    for i in range(10):
        try:
            n = task.get(timeout=1)
            print('run task %d * %d...' % (n, n))
            r = '%d * %d = %d' % (n, n, n * n)
            time.sleep(1)
            result.put(r)
        except queue.Queue.Empty:
            print('task queue is empty.')
    # 处理结束:
    print('worker exit.')

运行后,服务端输出如下:

Put task 0: 5070… Put task 1: 6275… Put task 2: 8098… Put task 3: 410… Put task 4: 5582… Put task 5: 5498… Put task 6: 1595… Put task 7: 4307… Put task 8: 7980… Put task 9: 5601… Try get results… Result for task 0: 5070 * 5070 = 25704900 Result for task 1: 6275 * 6275 = 39375625 Result for task 2: 8098 * 8098 = 65577604 Result for task 3: 410 * 410 = 168100 Result for task 4: 5582 * 5582 = 31158724 Result for task 5: 5498 * 5498 = 30228004 Result for task 6: 1595 * 1595 = 2544025 Result for task 7: 4307 * 4307 = 18550249 Result for task 8: 7980 * 7980 = 63680400 Result for task 9: 5601 * 5601 = 31371201 master exit.

客户端输出如下:

Connect to server 127.0.0.1… run task 5070 * 5070… run task 6275 * 6275… run task 8098 * 8098… run task 410 * 410… run task 5582 * 5582… run task 5498 * 5498… run task 1595 * 1595… run task 4307 * 4307… run task 7980 * 7980… run task 5601 * 5601… worker exit.

由此可见,通过Python的高度封装,实现一个分布式调度任务还是非常方便快捷的,这也是Python这类语言的优势所在。

本文由作者按照 CC BY 4.0 进行授权