赞
踩
目录
Celery 官网:Celery - Distributed Task Queue — Celery 5.2.7 documentation
Celery 官方文档英文版:Celery - Distributed Task Queue — Celery 5.3.0b1 documentation
Celery 官方文档中文版:Celery - 分布式任务队列 — Celery 3.1.7 文档
Celery是一个简单、灵活且可靠的,处理大量消息的分布式系统
1. 完成异步任务:可以提高项目的并发量,以前用多线程实现项目的并发量,现在可以使用celery来做
2. 完成延时任务
3. 完成定时任务
消息中间件: broker 提交的任务【函数】都放在这里, celery本身不能提供消息中间件,需要借助于第三方: redis, rabbitmq
任务执行单元: worker,是真正执行任务的的地方, 一个个进程中执行函数
结果存储: backend, 函数return的结果都存储在这里, celery本身不提供结果存储,需要借助于第三方: redis 数据库, rabbitmq
1, 可以不依赖任何服务器,通过自身命令来启动服务
2, celery服务为为其他项目服务提供一部解决任务的需求’ ## 会有两个服务同时运行,一个是项目服务,一个是celery服务, 项目服务讲需要异步处理的任务交给celery服务 , celery就会在需要时一步完成项目的需求
安装
psi3 install celery
使用步骤
1, 写一个main.py: 实例化得到app对象, 写函数,任务,注册成celery的任务,
2, 在别的程序中提交任务》》》提交到broker中去 add.delay(3,4)
执行异步任务
- add.apply_asyn()
-
- add.delay()
main.py
- import time
-
- from celery import Celery
-
- backend = 'redis://127.0.0.1:6379/1'
- broker = 'redis://127.0.0.1:6379/0'
-
- app = Celery('test',backend=backend,broker=broker)
- # 以上实例化得到对象
-
- # 写任务
- @app.task
- def add(a,b):
- time.sleep(3)
- print(a+b)
- return a+b
-

s1.py
-
- from main import add
-
- print('good evening')
- # 执行的时同步任务
- res = add(3,4)
- print(res)
-
-
- # 3 执行异步任务
- # add.apply_async()
-
- print(add.delay(2, 7)) # 74523b46-68a5-4429-b061-723ccf3f9b82
- print(add.delay(7, 5)) # 25e9b218-55ff-4a0a-a41f-76cde3ff8833
s2.py
-
- def outer(func):
- def inner(*args,**kwargs):
- res = func(*args,**kwargs)
- return res
- inner.delay='xxx'
- return inner
-
- @outer
- def add():
- print('aaa')
-
- #
- # add.name='yietong'
- print(add.delay)
-
-
-
'运行
3, 启动worker, 从broker中去任务执行,执行完放到backend中
- win:
- celery worker -A main -l info -P eventlet # 4.x及之前用这个
- celery -A main worker -l info -P eventlet # 5.x及之后用这个
- lin,mac:
- celery worker -A main -l info
- celery -A main worker -l info
eventlet模块需要安装 pip3 install eventlet
4, 在backend 中查看任务执行的结果
直接看或者通过代码查看
- from main import app
- from celery.result import AsyncResult
- id = '5f7bbf70-9946-4085-b993-f5b8a8d0bd11'
- if __name__ == '__main__':
- res = AsyncResult(id=id,app=app)
- if res.successful():
- result = res.get()
- print(result) # 12
- elif res.failed():
- print('任务失败')
- elif res.status == 'PENDING':
- print('任务正在等待中')
- elif res.status== 'STATED':
- print('任务已经开始被执行')
停掉worker后
重启服务后
项目
celery_task【包】
-__init__.py
-celery.py
-user_task.py
-home_task.py
add_task.py
get_result.py
写一个celery包,以后在任意项目中需要使用的时候把包copy进去,导入使用即可。
使用步骤;
- import celery
- from celery import Celery
-
- app = celery.Celery()
-
-
-
- backend = 'redis://127.0.0.1:6379/1'
- broker = 'redis://127.0.0.1:6379/0'
- # 一定不要忘了include
- app = Celery(__name__,broker=broker,backend=backend,include=['celery_task.home_task','celery_task.user_task'])
- import time
-
- from .celery import app
-
- @app.task
- def send_sms(mobile,code):
- time.sleep(1)
- print('短信发送成功:%s,验证码是%s'%(mobile,code))
- return True
- import time
-
- from .celery import app
-
- @app.task
- def add(a,b):
- time.sleep(3)
- print('计算结果时%s'%(a+b))
- return a+b
celery -A celery_task worker -l info -P eventlet
get_result.py
- from celery_task.celery import app
- from celery.result import AsyncResult
-
- def get(task_id):
- asy = AsyncResult(id=task_id, app=app)
- if asy.successful():
- res = asy.get()
- print('任务执行结果:', res)
- elif asy.failed():
- print('任务失败')
- elif asy.status == 'PENDING':
- print('任务等待中被执行')
- elif asy.status == 'RETRY':
- print('任务异常后正在重试')
- elif asy.status == 'STARTED':
- print('任务已经开始被执行')
-
- if __name__ == '__main__':
- # 任务id,提交任务时返回的结果
- task_id = 'bb52fd1a-43e6-4c36-852c-9b1c940a1ad7'
- get(task_id)

task.delay(*args,**kwargs)
- task.apply_async(args=[参数,参数],eta=时间对象(utc时间))
- """
- 参数
- args:任务需要的参数
- countdown:几秒后执行
- retry:任务失败是否重试,默认为True
- 其他参数:
- eta:时间对象
- """
- from celery_task.home_task import add
-
-
- # 提交一个add的异步任务
- #eta 是一个时间任务。 要写一个5秒后的时间对象
- from datetime import datetime,timedelta
- # 得到10miao后的时间,celery 默认使用utc时间
- eta = datetime.utcnow()+timedelta(seconds=10)
- res = add.apply_async(args=(200,20),eta=eta)
- print(res) # 9d609f6f-4d08-4b62-999c-a9466d3819e5
-1 app的配置文件中配置 ,写在celery.py中
-
- app.conf.beat_schedule = {
- 'send_sms_task': {
- 'task': 'celery_task.user_task.send_sms',
- 'schedule': timedelta(seconds=5),
- # 'schedule': crontab(hour=8, day_of_week=1), # 每周一早八点
- 'args': ('1897334444', '7777'),
- },
- 'add_task': {
- 'task': 'celery_task.home_task.add',
- 'schedule': crontab(hour=12, minute=10, day_of_week=3), # 每周一早八点
- 'args': (10, 20),
- }
- }
-2 启动worker :干活的人
celery -A celery_task worker -l info -P eventlet
-3 启动beat :提交任务的人
celery -A celery_task beat -l info
-
- # 设置时区
- app.conf.timezone ='Asia/Shanghai'
- # 是否使用utc时间
- app.conf.enable_utc = False
-
- from celery.schedules import crontab
- # app的配置信息
- app.conf.beat_schedule = {
- 'send_sms_task': {
- 'task': 'celery_task.user_task.send_sms',
- 'schedule': timedelta(seconds=5),
- # 'schedule': crontab(hour=8, day_of_week=1), # 每周一早八点
- 'args': ('18595992917', '7777'),
- },
- 'add_task': {
- 'task': 'celery_task.home_task.add',
- 'schedule': crontab(hour=22, minute=10, day_of_week=3), # 每周一早八点
- 'args': (10, 20),
- }
- }

补充:
如果公司只想做定时任务, celery比较大,比较麻烦,一般公司会使用 pip install apscheduler
- # 每隔多长事件
- import time
- from apscheduler.schedulers.blocking import BlockingScheduler
- # 任务
- def my_job(i):
- print (i)
- sched = BlockingScheduler()
- sched.add_job(my_job, 'interval', seconds=5,values=['学会了'])
-
- ## 按年月日
- import datetime
- from apscheduler.schedulers.blocking import BlockingScheduler
- scheduler = BlockingScheduler()
- def my_job(text):
- print(text)
- # datetime类型(用于精确时间)
- scheduler.add_job(my_job, 'date', run_date=datetime(2022, 4, 25, 17, 30, 5), args=['测试任务'])
-
- ## 按corn
- import datetime
- from apscheduler.schedulers.background import BackgroundScheduler
- def job_func(text):
- print("当前时间:", datetime.datetime.utcnow().strftime("%Y-%m-%d %H:%M:%S.%f")[:-3])
-
- scheduler = BackgroundScheduler()
- # 在每年 1-3、7-9 月份中的每个星期一、二中的 00:00, 01:00, 02:00 和 03:00 执行 job_func 任务
- scheduler .add_job(job_func, 'cron', month='1-3,7-9',day='0, tue', hour='0-3')
-

使用步骤:
1 把写好的包(celery_task)复制到项目路径下
2 在包内的celery.py 的上面加入代码
- import os
- os.environ.setdefault('DJANGO_SETTINGS_MODULE', 'luffy_api.settings.dev')
- import django
- django.setup()
3 在django的视图类中,导入,提交任务
- 任务.delay()
- 任务.apply_async()
4 启动worker,beat
- celery -A celery_task worker -l info -P eventlet
-
-
- celery -A celery_task beat -l info
redis双写一致性指的是redis和数据库的数据要同时更新
我们都知道把数据库的数据暂存与redis,之后取数据都去redis中去, 这样就可以减少时间消耗,但是会出现一个问题, 数据库更i轩尼诗,redis没有更新,使用取数据取到的还是原来的值。
首先要了解数据库的数据是什么时候存到redis中的
一般来说, 前端发送Ajax请求,会先从redis中取,如果有值,则直接返回,如果没有值,就从数据库中取值并保存到redis中。
使用根据以上流程有以下解决办法
1. 先更新数据库,在更新缓存
2, 先删除缓存,在更新数据库
3,先更新数据库,在删除缓存(这种比较多)
4,定时更新缓存(隔5分钟更新一次)
视图类
- class BannerView(GenericViewSet, ListModelMixin):
- queryset = models.Banner.objects.all()
- serializer_class = serializer.BannerSerializer
-
- def list(self, request, *args, **kwargs):
- banner_list = cache.get('banner_list')
- if banner_list:
- # redis中有值直接返回
- return Response(banner_list)
- else:
- # redis中没有值,获取数据再存入redis
- res = super(BannerView, self).list(request, *args, **kwargs)
- cache.set('banner_list', res.data)
- return res
celery.py
- from celery import Celery
- import os
-
- os.environ.setdefault("DJANGO_SETTINGS_MODULE", "luffyapi.settings.dev")
- import django
-
- django.setup()
-
- broker = 'redis://127.0.0.1:6379/2'
- backend = 'redis://127.0.0.1:6379/3'
- include = [
- 'celery_task.tasks'
- ]
-
- app = Celery('main', broker=broker, backend=backend, include=include)
- from datetime import timedelta
-
- app.conf.beat_schedule = {
- 'banner_update': {
- 'task': 'celery_task.tasks.banner_update', # 任务路径
- 'schedule': timedelta(seconds=10), # 定时
- 'args': (), # 任务参数
- }
- }

任务
- @app.task
- def banner_update():
- query_set = models.Banner.objects.all()
- ser = serializer.BannerSerializer(instance=query_set, many=True)
- cache.set('banner_list', ser.data)
- return True
前端使用秒杀按钮,
事件: 像后端秒杀接口发送请求, 发送完立马起一个定时任务, 每隔5秒,像后端查看一下是否秒杀成功, 如果没成功,定时任务继续执行, 如果成功,清空定时任务。
- handleClick() {
- this.$axios.get(this.$settings.BASE_URL + 'userinfo/seckill/').then(res => {
- if (res.data.code == 100) {
- let task_id = res.data.id
- this.$message({
- message: res.data.msg,
- type: 'error'
- });
- // 起个定时任务,每隔5s向后端查询一下是否秒杀成功
- let t = setInterval(() => {
- this.$axios.get(this.$settings.BASE_URL + 'userinfo/get_result/?id=' + task_id).then(
- res => {
- if (res.data.code == 100 || res.data.code == 101) { //秒杀结束了,要么成功,要么失败了
- alert(res.data.msg)
- // 销毁掉定时任务
- clearInterval(t)
- } else if (res.data.code == 102) {
- //什么事都不干
- }
- }
- )
- }, 5000)
-
-
- }
- })
- }

后端:
秒杀接口
提交秒杀任务
- def seckill(request):
- # 提交秒杀任务
- res = seckill_task.delay()
- return JsonResponse({'code': 100, 'msg': '正在排队', 'id': str(res)})
'运行
查询是否秒杀成功的接口 【根据用户传入的id,查询任务是否成功】
- def get_result(request):
- task_id = request.GET.get('id')
- res = AsyncResult(id=task_id, app=app)
- if res.successful():
- result = res.get() # 7
- return JsonResponse({'code': 100, 'msg': str(result)})
- elif res.failed():
- print('任务失败')
- return JsonResponse({'code': 101, 'msg': '秒杀失败'})
- elif res.status == 'PENDING':
- print('任务等待中被执行')
- return JsonResponse({'code': 102, 'msg': '还在排队'})
'运行
接口增加缓存
首页轮播图接口增加缓存, 提高了接口的响应速度,提高并发量
- class BannerView(GenericViewSet, CommonListModelMixin):
- queryset = Banner.objects.all().filter(is_delete=False, is_show=True).order_by('orders')[:settings.BANNER_COUNT]
- serializer_class = BannerSerializer
-
- def list(self, request, *args, **kwargs):
- result = cache.get('banner_list')
- if result: # 缓存里有
- print('走了缓存,速度很快')
- return APIResponse(result=result)
- else:
- # 去数据库拿
- print('走了数据库,速度慢')
- res = super().list(request, *args, **kwargs)
- result = res.data.get('result') # {code:100,msg:成功,result:[{},{}]}
- cache.set('banner_list', result)
- return res

加了缓存,如果MySQL数据库变了,由于请求的都是缓存的数据,导致MySQL和redis的数据不一致, 这就涉及到了双写一致性的问题
1, 修改MySQL数据库,删除缓存,
2, 修改数据库,修改缓存
3, 定时更新缓存 》》 针对实时性不是很高的接口适合定时更新
给首页轮播图接口加了缓存,出现了双写一致性问题, 使用定时更新来解决双写一致性的问题【会存在不一致的情况,可以忽略】 使用celery定时任务
home_task.py
- @app.task
- def update_banner():
- # 更新缓存
- # 查询出现在轮播图的数据
- queryset = Banner.objects.all().filter(is_delete=False, is_show=True).order_by('orders')[:settings.BANNER_COUNT]
- ser = BannerSerializer(instance=queryset, many=True)
- # ser 中得图片,没有前面地址
- for item in ser.data:
- item['image'] = settings.HOST_URL + item['image']
- cache.set('banner_list', ser.data)
- return True
celery.py
- app.conf.beat_schedule = {
- 'update_banner': {
- 'task': 'celery_task.home_task.update_banner',
- 'schedule': timedelta(seconds=50),
- 'args': (),
- }
- }
启动django, worker,beat
第一次访问: 查的数据库放入了缓存,以后再访问就走缓存。 一旦MySQL数据改了,缓存可能不一致。 定时更新,保持了一致
补充:
@app.task 与@shared.task的区别
他俩的作用一样, 第一个需要执行app, 第二个直接导入使用, 直接从内存中取出来app对象
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。