赞
踩
目录
线程池是一种线程使用模式。线程池里面可以维护一些线程。
为什么要有线程池?
因为在我们使用线程去处理各种任务的时候,尤其是一些执行时间短的任务,我们必须要先对线程进行创建然后再进行任务处理,最后再销毁线程,效率是比较低的。而且有的时候线程过多会带来调度开销,进而影响缓存局部性和整体性能。
于是,我们可以通过线程池预先创建出一批线程,线程池维护着这些线程,线程等待着监督管理者分配可并发执行的任务。这避免了在处理短时间任务时创建与销毁线程的代价。
线程池不仅能够保证内核的充分利用,还能防止过分调度。
我们先对线程进行封装:Thread.hpp
- #pragma once
- #include <iostream>
- #include <string>
- #include <cstdio>
- #include <pthread.h>
-
- using namespace std;
- typedef void *(*fun_t)(void *);
-
- class ThreadData
- {
- public:
- void *arg_;
- string name_;
- };
-
- class Thread
- {
- public:
- Thread(int num, fun_t callback, void *arg)
- : func_(callback)
- {
- char buffer[64];
- snprintf(buffer, sizeof(buffer), "Thread-%d", num);
- name_ = buffer;
- tdata_.name_ = name_;
- tdata_.arg_ = arg;
- }
-
- void start()
- {
- pthread_create(&tid_, nullptr, func_, (void *)&tdata_);
- }
-
- void join()
- {
- pthread_join(tid_, nullptr);
- }
-
- string &name()
- {
- return name_;
- }
-
- ~Thread()
- {
- }
-
- private:
- pthread_t tid_;
- string name_;
- fun_t func_;
- ThreadData tdata_;
- };
线程池代码:threadPool.hpp:
- #pragma once
- #include <vector>
- #include <queue>
- #include "thread.hpp"
-
- #define THREAD_NUM 3
-
- template <class T>
- class ThreadPool
- {
- public:
- bool Empty()
- {
- return task_queue_.empty();
- }
-
- pthread_mutex_t *getmutex()
- {
- return &lock;
- }
-
- void wait()
- {
- pthread_cond_wait(&cond, &lock);
- }
-
- T gettask()
- {
- T t = task_queue_.front();
- task_queue_.pop();
- return t;
- }
-
- public:
- ThreadPool(int num = THREAD_NUM) : num_(num)
- {
- for (int i = 0; i < num_; i++)
- {
- threads_.push_back(new Thread(i, routine, this));
- }
- pthread_mutex_init(&lock, nullptr);
- pthread_cond_init(&cond, nullptr);
- }
-
- static void *routine(void *arg)
- {
- ThreadData *td = (ThreadData *)arg;
- ThreadPool<T> *tp = (ThreadPool<T> *)td->arg_;
- while (true)
- {
- T task;
- {
- pthread_mutex_lock(tp->getmutex());
- while (tp->Empty())
- tp->wait();
- task = tp->gettask();
- pthread_mutex_unlock(tp->getmutex());
- }
- cout << "x+y=" << task() << " " << pthread_self() << endl;
- }
- }
-
- void run()
- {
- for (auto &iter : threads_)
- {
- iter->start();
- }
- }
-
- void PushTask(const T &task)
- {
- pthread_mutex_lock(&lock);
- task_queue_.push(task);
- pthread_mutex_unlock(&lock);
- pthread_cond_signal(&cond);
- }
-
- ~ThreadPool()
- {
- for (auto &iter : threads_)
- {
- iter->join();
- delete iter;
- }
- pthread_mutex_destroy(&lock);
- pthread_cond_destroy(&cond);
- }
-
- private:
- vector<Thread *> threads_;
- int num_;
- queue<T> task_queue_;
- pthread_mutex_t lock;
- pthread_cond_t cond;
- };
任务:task.hpp:
- #pragma once
-
- #include <iostream>
- #include <queue>
- #include <pthread.h>
- #include <unistd.h>
-
- class task
- {
- public:
- task()
- {
- }
- task(int x, int y)
- : x_(x), y_(y)
- {
- }
-
- int operator()()
- {
- return x_ + y_;
- }
-
- private:
- int x_;
- int y_;
- };
测试代码:test.cc:
- #include "threadPool.hpp"
- #include "task.hpp"
- #include <iostream>
- #include <ctime>
-
- int main()
- {
- srand((unsigned int)time(nullptr) ^ getpid() ^ 12232);
- ThreadPool<task> *tp = new ThreadPool<task>();
- tp->run();
- while (true)
- {
- int x = rand() % 100 + 1;
- sleep(1);
- int y = rand() % 100 + 1;
- task t(x, y);
- tp->PushTask(t);
- cout << x << "+" << y << "=?" << endl;
- }
-
- return 0;
- }
运行结果:
1、需要大量的线程来完成任务,且完成任务的时间比较短。
2、对性能要求苛刻的应用,比如要求服务器迅速响应客户请求。
3、接受突发性的大量请求,但不至于使服务器因此产生大量线程的应用。突发性大量客户请求,在没有线程池情况下,将产生大量线程,虽然理论上大部分操作系统线程数目最大值不是问题,短时间内产生大量线程可能使内存到达极限,出现错误。
首先,我们要做的第一件事就是把构造函数私有,再把拷贝构造和赋值运算符重载函数delete:
- private:
- ThreadPool(int num = THREAD_NUM) : num_(num)
- {
- for (int i = 0; i < num_; i++)
- {
- threads_.push_back(new Thread(i, routine, this));
- }
- pthread_mutex_init(&lock, nullptr);
- pthread_cond_init(&cond, nullptr);
- }
-
- ThreadPool(const TreadPool &other) = delete;
- ThreadPool operator=(const TreadPool &other) = delete;
接下来就要在类中定义一个成员变量:静态指针,方便获取单例对象,并在类外初始化:
- //线程池中的成员变量
- private:
- vector<Thread *> threads_;
- int num_;
- queue<T> task_queue_;
- pthread_mutex_t lock;
- pthread_cond_t cond;
-
- static ThreadPool<T> *tp;
-
- //在类外初始化
- template <class T>
- ThreadPool<T> *ThreadPool<T>::tp = nullptr;
最后我们写一个函数可以获取单例对象,在设置获取单例对象的函数的时候,注意要设置成静态成员函数,因为在获取对象前根本没有对象,无法调用非静态成员函数(无this指针):
- static ThreadPool<T> *getThreadPool()
- {
- if (tp == nullptr)
- {
- tp = new ThreadPool<T>();
- }
- return tp;
- }
上面的线程池的单例模式,看起来没有什么问题。可是当我们有多个线程去调用 getThreadPool函数,去创建线程池的时候,可能会有多个线程同时进入判断,判断出线程池指针为空,然后创建线程池对象。这样就会创建出多个线程池对象,这就不符合我们单例模式的要求了,所以我们必须让在同一时刻只有一个线程能够进入判断,我们就要用到锁了。
定义一个静态锁,并初始化:
- private:
- vector<Thread *> threads_;
- int num_;
- queue<T> task_queue_;
- pthread_mutex_t lock;
- pthread_cond_t cond;
- static ThreadPool<T> *tp;
- static pthread_mutex_t lock;
-
- // 类外初始化
- template <class T>
- pthread_mutex_t ThreadPool<T>::lock = PTHREAD_MUTEX_INITIALIZER;
对 getThreadPool函数进行加锁:
- static ThreadPool<T> *getThreadPool()
- {
- if (tp == nullptr)
- {
- pthread_mutex_lock(&lock);
- if (tp == nullptr)
- {
- tp = new ThreadPool<T>();
- }
- pthread_mutex_unlock(&lock);
- }
- return tp;
- }
对于上面的代码:我们为什么要在获取锁之前还要再加一个判断指针为空的条件呢?
当已经有一个线程创建出来了线程池的单例模式后,在这之后的所有其他线程即使申请到锁,紧着着下一步就是去释放锁,它不会进入第二个 if 条件里面。其实这样是效率低下的,因为线程会频繁申请锁,然后就释放锁。所以我们在最外层再加一个if判断,就可以阻止后来的线程不用去申请锁创建线程池了,直接返回已经创建出来的线程池。
1、悲观锁:在每次取数据时,总是担心数据会被其他线程修改,所以会在取数据前先加锁(读锁,写锁,行锁等),当其他线程想要访问数据时,被阻塞挂起。
2、乐观锁:每次取数据时候,总是乐观的认为数据不会被其他线程修改,因此不上锁。但是在更新数据前,会判断其他数据在更新前有没有对数据进行修改。主要采用两种方式:版本号机制和CAS操作。
~ CAS操作:当需要更新数据时,判断当前内存值和之前取得的值是否相等。如果相等则用新值更新。若不等则失败,失败则重试,一般是一个自旋的过程,即不断重试。
3、自旋锁:说到自旋锁,我们不得不说一说我们之前所用到的锁,我们之前所用的锁都是互斥锁,当线程没有竞争到互斥锁时,它会阻塞等待,只有等锁被释放了后,才能去重新申请锁。而对于自旋锁,当线程没有竞争到自旋锁的时候,线程会不断地循环检测去申请自旋锁,直到拿到锁。
一般来说,如果临界区的代码执行时间比较长的话,我们是使用互斥锁而不是自旋锁的,这样线程不会因为频繁地检测去申请锁而占用CPU资源。如果临界区的代码执行时间较短的话,我们一般就最好使用自旋锁,而不是互斥锁,因为互斥锁申请失败,是要阻塞等待,是需要发生上下文切换的,如果临界区执行的时间比较短,那可能上下文切换的时间会比临界区代码执行的时间还要长。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。