赞
踩
使用的语言: Python3.5
分布式机器: windows7
下面开始讲述搭建过程
pip install dask[complete]
(如果已经安装好这个库了就会提示已经安装好了)库是一定要安装的。而且这个库特别小。1MB左右???大胆下吧
首先,在一台电脑上(命令行条件下, 输入dask-scheduler
。就会爆出一堆的信息。其中有个地方很关键
在我这,就是使用那个tcp://,后面的那个地址,加上端口号。
dask-worker 192.168.0.199:8786
。注意到,这里的这个地址其实就是刚刚说到的那个地址,每个人的结果都会是不一样的。大家根据自己的情况来决定。scheduler
电脑,上的信息出现了别的信息之后。就连接成功了。用户是一台新的电脑(当然,也可以是任何的一台电脑。但是必须要跟这些电脑都在同样的一个局域网下。在这样的条件下,开始使用,我们之前搭建好的服务器。
下面是我在一个一台电脑上运行的写的代码
记得!,要把client上的IP地址跟端口号都写成之前Scheduler的IP地址跟端口号。
下面是我用代码:
from dask.distributed import Client
from time import time
def square(x):
return x ** 2
if __name__ == '__main__':
MAX = 1000
st = time()
client = Client('192.168.0.199:8786') # 这里的地址记得根据我上面说的修改掉。
A = client.map(square, range(MAX))
total = client.submit(sum, A)
print(total.result())
et = time()
print(et - st)
这是输出的结果:
332833500
0.6459999084472656
这个框架搭建好,以后,我们以后就只需要通过修改函数的本质,就可以实现关于分布式了。
有人可能会说,这么简单的分布式,为什么工资会高?
我想给有这样想法的朋友说一下。
首先,要知道这个工具的开发者将这个工具开发的已经非常好了,接口分装的特别不错。他们的付出是值得大家认可的。
其次,理解,并使用这个框架也不是很容易的(请给我鼓励
再来,这只是一个非常简单的Demo。其中还有很多的细节需要注意的,都没有。很多算法需要解决的,也没有。
可以说,这里的坑还有很多!
最后,我想肯定还是有我不知道的东西的!所以…
…
最后,老套路,宣传一波自己的公众号!(求关注哇!)
本人中大一肥宅,欢迎大家关注,请扫下面的二维码(〃’▽’〃)
如果觉得有帮助的话,可以扫码,赞赏鼓励一下!谢谢!
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。