替代Druid,HakariCP 为什么这么快?

大家好，我是锋哥，最近开始收Java学员啦！

引言

Springboot 2.0将 HikariCP 作为默认数据库连接池这一事件之后，HikariCP 作为一个后起之秀出现在大众的视野中。HikariCP 是在日本的程序员开源的，hikari日语意思为“光”，HikariCP 也以速度快的特点受到越来越多人的青睐。

今天就让我们来探讨一下HikariCP为什么这么快？

连接池技术

我们平常编码过程中，经常会碰到线程池啊，数据库连接池啊等等，那么这个池到底是一门怎样的技术呢？

简单来说，连接池是一个创建和管理连接的缓冲池技术。连接池主要由三部分组成：连接池的建立、连接池中连接的使用管理、连接池的关闭。

连接池技术的核心思想是：连接复用，通过建立一个数据库连接池以及一套连接使用、分配、管理策略，使得该连接池中的连接可以得到高效、安全的复用。它不仅仅只限于管理数据库访问连接，也可以管理其他连接资源。

HakariCP

HakariCP 项目的 README 中的一段话。

“
Fast, simple, reliable. HikariCP is a "zero-overhead" production ready JDBC connection pool. At roughly 130Kb, the library is very light.

快速、简单、可靠。HikariCP是一个“零开销”的生产就绪JDBC连接池。这个库大约有130Kb，非常轻。

这个介绍真是简洁但“全面”。搭配上下边这张图。

看到这些数据，再加上Springboot 2.0 将 HikariCP 作为默认数据库连接池这件事，我已经十分好奇 HikariCP 的实现原理了。

HikariCP为什么这么快？

两个HikariPool：定义了两个HikariPool对象，一个采用final类型定义，避免在获取连接时才初始化，提高性能，也避免volatile的额外开销。
FastList替代ArrayList：采用自定义的FastList替代了ArrayList，FastList的get方法去除了范围检查逻辑，并且remove方法是从尾部开始扫描的，而并不是从头部开始扫描的。因为Connection的打开和关闭顺序通常是相反的。
更快的并发集合实现：使用自定义ConcurrentBag，性能更优。
更快的获取连接：同一个线程获取数据库连接时从ThreadLocal中获取，没有并发操作。
精简字节码：HikariCP利用了一个第三方的Java字节码修改类库Javassist来生成委托实现动态代理，速度更快，相比于JDK 代理生成的字节码更少。

HikariCP原理

我们通过分析源码来看 HikariCP 是如何这么快的。先来看一下 HikariCP 的简单使用。

maven依赖:

<dependency>  
    <groupId>com.zaxxer</groupId>  
    <artifactId>HikariCP</artifactId>  
    <version>4.0.3</version>  
</dependency>

@Test  
public void testHikariCP() throws SQLException {  
    // 1、创建Hikari配置  
    HikariConfig hikariConfig = new HikariConfig();  
    // JDBC连接串  
    hikariConfig.setJdbcUrl("jdbc:mysql://127.0.0.1:3306/iam?characterEncoding=utf8");  
    // 数据库用户名  
    hikariConfig.setUsername("root");  
    // 数据库用户密码  
    hikariConfig.setPassword("123456");  
    // 连接池名称  
    hikariConfig.setPoolName("testHikari");  
    // 连接池中最小空闲连接数量  
    hikariConfig.setMinimumIdle(4);  
    // 连接池中最大空闲连接数量  
    hikariConfig.setMaximumPoolSize(8);  
    // 连接在池中的最大空闲时间  
    hikariConfig.setIdleTimeout(600000L);  
    // 数据库连接超时时间  
    hikariConfig.setConnectionTimeout(10000L);  
  
    // 2、创建数据源  
    HikariDataSource dataSource = new HikariDataSource(hikariConfig);  
  
    // 3、获取连接  
    Connection connection = dataSource.getConnection();  
  
    // 4、获取Statement  
    Statement statement = connection.createStatement();  
  
    // 5、执行Sql  
    ResultSet resultSet = statement.executeQuery("SELECT COUNT(*) AS countNum tt_user");  
  
    // 6、输出执行结果  
    if (resultSet.next()) {  
        System.out.println("countNum结果为：" + resultSet.getInt("countNum"));  
    }  
  
    // 7、释放链接  
    resultSet.close();  
    statement.close();  
    connection.close();  
    dataSource.close();  
}

HikariConfig：可以设置一些数据库基本配置信息和一些连接池的配置信息。

HikariDataSource：实现了 DataSource，DataSource是一个数据源标准或者说规范，Java所有连接池需要基于这个规范进行实现。

我们就从 HikariDataSource 开始说起。HikariDataSource有两个构造方法HikariDataSource()和HikariDataSource(HikariConfig configuration)。

private final HikariPool fastPathPool;  
private volatile HikariPool pool;  
  
public HikariDataSource()  
{  
   super();  
   fastPathPool = null;  
}  
public HikariDataSource(HikariConfig configuration)  
{  
   configuration.validate();  
   configuration.copyStateTo(this);  
  
   LOGGER.info("{} - Starting...", configuration.getPoolName());  
   pool = fastPathPool = new HikariPool(this);  
   LOGGER.info("{} - Start completed.", configuration.getPoolName());  
  
   this.seal();  
}

HikariPool为什么要有两个（fastPathPool和pool）呢？

可以看到无参构造方法fastPathPool是null，有参构造pool = fastPathPool，采用无参构造在getConnection()时候才会初始化（下边会详细讲解），性能略低，并且pool是volatile关键字修饰，会有一些额外开销。所以建议使用有参构造。这也是HikariPool快的原因之一。

有参构造里有一行new HikariPool(this)，我们来看一下怎么个事。

代码太多了，往后只贴关键代码了。。。

public HikariPool(final HikariConfig config)  
{  
   super(config);  
   // 初始化ConcurrentBag对象  
   this.connectionBag = new ConcurrentBag<>(this);  
   // 创建SuspendResumeLock对象   
   this.suspendResumeLock = config.isAllowPoolSuspension() ? new SuspendResumeLock() : SuspendResumeLock.FAUX_LOCK;  
   // 根据配置的最大连接数,创建链表类型阻塞队列  
   LinkedBlockingQueue<Runnable> addConnectionQueue = new LinkedBlockingQueue<>(maxPoolSize);  
   this.addConnectionQueueReadOnlyView = unmodifiableCollection(addConnectionQueue);  
   // 初始化创建连接线程池  
   this.addConnectionExecutor = createThreadPoolExecutor(addConnectionQueue, poolName + " connection adder", threadFactory, new ThreadPoolExecutor.DiscardOldestPolicy());  
   // 初始化关闭连接线程池  
   this.closeConnectionExecutor = createThreadPoolExecutor(maxPoolSize, poolName + " connection closer", threadFactory, new ThreadPoolExecutor.CallerRunsPolicy());  
   // 创建保持连接池连接数量的任务  
   this.houseKeeperTask = houseKeepingExecutorService.scheduleWithFixedDelay(new HouseKeeper(), 100L, housekeepingPeriodMs, MILLISECONDS);  
   ...  
}

HikariPool 是为HikariCP提供基本池行为的主要连接池类。

houseKeepingExecutorService.scheduleWithFixedDelay(new HouseKeeper(), 100L, housekeepingPeriodMs, MILLISECONDS)这行代码是创建保持连接池连接数量的任务。该任务会关闭需要被丢弃的连接，保证最小连接数，HouseKeeper类的run()方法中有一行代码fillPool()会创建连接，我们来看一下。

创建连接

private synchronized void fillPool()  
{  
    // 计算需要添加的连接数量  
    final int connectionsToAdd = Math.min(config.getMaximumPoolSize() - getTotalConnections(), config.getMinimumIdle() - getIdleConnections()) - addConnectionQueue.size();  
    for (int i = 0; i < connectionsToAdd; i++) {  
        // 向创建连接线程池中提交创建连接的任务  
        addConnectionExecutor.submit((i < connectionsToAdd - 1) ? poolEntryCreator : postFillPoolEntryCreator);  
    }  
    ...  
}

来看一下PoolEntryCreator是如何创建连接的。

@Override  
public Boolean call()  
{  
   // 连接池状态正常并且需求创建连接时  
   while (poolState == POOL_NORMAL && shouldCreateAnotherConnection()) {  
      // 创建PoolEntry对象  
      final PoolEntry poolEntry = createPoolEntry();  
      if (poolEntry != null) {  
         // 将PoolEntry对象添加到ConcurrentBag对象中的sharedList中  
         connectionBag.add(poolEntry);  
         return Boolean.TRUE;  
      }  
   }  
   ...  
   return Boolean.FALSE;  
}

PoolEntryCreator实现了Callable接口，在call()方法里可以看到创建连接的过程。来继续看一下createPoolEntry()方法。

private PoolEntry createPoolEntry()  
{  
    // 初始化PoolEntry对象  
    final PoolEntry poolEntry = newPoolEntry();  
    ...  
}

继续进入newPoolEntry()方法。

PoolEntry newPoolEntry() throws Exception  
{  
   return new PoolEntry(newConnection(), this, isReadOnly, isAutoCommit);  
}

PoolEntry构造时会先创建Connection对象传入构造函数中。PoolEntry是ConcurrentBag实例中用来跟踪Connection的。

获取链接

获取链接是通过getConnection()方法获取的，源码如下。

public Connection getConnection() throws SQLException  
{  
   if (isClosed()) {  
      throw new SQLException("HikariDataSource " + this + " has been closed.");  
   }  
     
   if (fastPathPool != null) {  
      return fastPathPool.getConnection();  
   }  
  
   HikariPool result = pool;  
   if (result == null) {  
      synchronized (this) {  
         result = pool;  
         if (result == null) {  
            validate();  
            LOGGER.info("{} - Starting...", getPoolName());  
            try {  
               pool = result = new HikariPool(this);  
               this.seal();  
            }  
            catch (PoolInitializationException pie) {  
               if (pie.getCause() instanceof SQLException) {  
                  throw (SQLException) pie.getCause();  
               }  
               else {  
                  throw pie;  
               }  
            }  
            LOGGER.info("{} - Start completed.", getPoolName());  
         }  
      }  
   }

会先去fastPathPool获取连接，如果fastPathPool为null，就会通过pool获取，如果pool也为null，会通过双检代码来初始化线程池。

这个上文提到过为什么两个HikariPool，fastPathPool是 final 修饰的，而pool是 volatile 修饰的，这就说明fastPathPool比pool性能更高，所以建议要用有参构造来创建HikariDataSource，才能享受到这点小细节的优化。

继续进入HikariPool#getConnection(final long hardTimeout)，方法中有一行关键的代码PoolEntry poolEntry = connectionBag.borrow(timeout, MILLISECONDS)，这行代码的作用是从ConcurrentBag中借出一个PoolEntry对象。PoolEntry可以看作是对Connection对象的封装，连接池中存储的连接其实就是一个个的PoolEntry。

这个connectionBag是用来做什么的呢？

ConcurrentBag

ConcurrentBag 是HikariCP自定义的一个无锁并发集合类。我们接着来看一下 ConcurrentBag 的成员变量。

private final CopyOnWriteArrayList<T> sharedList;  
private final boolean weakThreadLocals;  
  
private final ThreadLocal<List<Object>> threadList;  
private final IBagStateListener listener;  
private final AtomicInteger waiters;  
private volatile boolean closed;  
  
private final SynchronousQueue<T> handoffQueue;

回到borrow()方法，看一下borrow的实现逻辑。

public T borrow(long timeout, final TimeUnit timeUnit) throws InterruptedException  
{  
   // 从ThreadLocal中获取当前线程绑定的对象集合，存在则获取  
   final List<Object> list = threadList.get();  
   for (int i = list.size() - 1; i >= 0; i--) {  
      final Object entry = list.remove(i);  
      @SuppressWarnings("unchecked")  
      final T bagEntry = weakThreadLocals ? ((WeakReference<T>) entry).get() : (T) entry;  
      if (bagEntry != null && bagEntry.compareAndSet(STATE_NOT_IN_USE, STATE_IN_USE)) {  
         return bagEntry;  
      }  
   }  
  
   // 等待对象加一  
   final int waiting = waiters.incrementAndGet();  
   try {  
      // sharedList有未使用的则返回一个  
      for (T bagEntry : sharedList) {  
         if (bagEntry.compareAndSet(STATE_NOT_IN_USE, STATE_IN_USE)) {  
            // If we may have stolen another waiter's connection, request another bag add.  
            if (waiting > 1) {  
               listener.addBagItem(waiting - 1);  
            }  
            return bagEntry;  
         }  
      }  
      // sharedList没有，添加一个监听任务  
      listener.addBagItem(waiting);  
  
      timeout = timeUnit.toNanos(timeout);  
      do {  
         final long start = currentTime();  
         // 阻塞队列计时获取  
         final T bagEntry = handoffQueue.poll(timeout, NANOSECONDS);  
         if (bagEntry == null || bagEntry.compareAndSet(STATE_NOT_IN_USE, STATE_IN_USE)) {  
            return bagEntry;  
         }  
  
         timeout -= elapsedNanos(start);  
      } while (timeout > 10_000);  
  
      return null;  
   }  
   finally {  
      // 等待线程数减一  
      waiters.decrementAndGet();  
   }  
}

先从ThreadLocal中获取以前用过的连接。ThreadLocal是当前线程的缓存，加快本地连接获取速度。
ThreadLocal中未获取到，会尝试从sharedList中获取，sharedList集合存在初始化的PoolEntry。sharedList是CopyOnWriteArrayList类型的，写时复制，特别适合这种读多写少的场景。
sharedList中未获取到那就到阻塞队列中等着，看有没有归还的连接可以使用。

释放连接

用完连接后我们要释放，通过connection.close()释放连接，释放连接时HakariCP也做到了一些巧妙的细节。ProxyConnection的close()方法是HakariCP释放连接的实现逻辑。我们知道连接关闭前必须要关闭Statement，HakariCP对这里做了优化，来看一下代码实现。

private final FastList<Statement> openStatements;  
  
private synchronized void closeStatements()  
{  
   final int size = openStatements.size();  
   if (size > 0) {  
      for (int i = 0; i < size && delegate != ClosedConnection.CLOSED_CONNECTION; i++) {  
         try (Statement ignored = openStatements.get(i)) {  
         }  
         catch (SQLException e) {  
            LOGGER.warn("{} - Connection {} marked as broken because of an exception closing open statements during Connection.close()",  
                        poolEntry.getPoolName(), delegate);  
            leakTask.cancel();  
            poolEntry.evict("(exception closing Statements during Connection.close())");  
            delegate = ClosedConnection.CLOSED_CONNECTION;  
         }  
      }  
  
      openStatements.clear();  
   }  
}

存储Statement对象用的是 FastList，这也是 HakariCP 之所以快的原因之一。

为什么用FastList而不用ArrayList呢？

去掉索引范围检查：查看源码会发现，FastList的get()方法比ArrayList少了一行代码rangeCheck(index)，这行代码的作用是范围检查，少了这行代码必然会性能更优。不禁感叹真的是太细了啊，到处都是细节。
尾部删除：FastList#remove()方法是从尾部开始扫描的，而并不是从头部开始扫描的。因为Connection的打开和关闭顺序通常是相反的。FastList的根据下标删除方法也去掉索引范围检查。

关闭掉Statement之后，我们再回过头来继续往下看。

poolEntry.recycle(lastAccess);

recycle方法会将该连接归还给线程池，recycle方法套了好几层，最终执行的是ConnectionBag的recycle方法，我们直接进入看一下。

public void requite(final T bagEntry)  
{  
   bagEntry.setState(STATE_NOT_IN_USE);  
  
   for (int i = 0; waiters.get() > 0; i++) {  
      if (bagEntry.getState() != STATE_NOT_IN_USE || handoffQueue.offer(bagEntry)) {  
         return;  
      }  
      else if ((i & 0xff) == 0xff) {  
         parkNanos(MICROSECONDS.toNanos(10));  
      }  
      else {  
         Thread.yield();  
      }  
   }  
  
   final List<Object> threadLocalList = threadList.get();  
   if (threadLocalList.size() < 50) {  
      threadLocalList.add(weakThreadLocals ? new WeakReference<>(bagEntry) : bagEntry);  
   }  
}

首先将状态设置为未使用，然后判断当前是否存在等待连接的线程，如果存在则将连接加入到公平队列中，由队列中有等待连接的线程则会从阻塞队列中去获取使用；如果当前没有等待连接的线程，并且ThreadLocal中的连接小于50，则将连接添加到本地线程变量ThreadLocal缓存中，当前线程下次获取连接时直接可从ThreadLocal中获取到。

总结

这次源码探究，真的感觉看到了无数个小细节，无数个小优化，积少成多。平时开发过程中，一些小的细节也一定要“扣”。

来源｜juejin.cn/post/7200782261997191225

End
锋哥简介
Java1234_小锋，真名：曹锋，前世界500强央企软件工程师，12年Java,Python老司机，技术专家，资深Java,Python讲师，小锋网络科技 光杠司令员，司令部：www.java1234.com，www.python222.com 每天坚持锻炼身体，坚持早睡早起，崇尚自由，平时喜欢带带Java学员 (已经成功指导2000+学员高薪就业)，喜欢搞搞Java技术自媒体，搞搞产品，后期继续研究主流技术，包括大数据，人工智能等。锋哥在公众号里整理了一份Java从入门到入土高级视频+Java常见笔试面试题+Java优秀简历模版，有需要的，可以关注下锋哥公众号，回复【 资料 】领取。
66套Java精品项目实战教程
爆了！高级Python学习大礼包 ~直接拿走~
SpringSecurity+Vue权限系统(42讲) 震撼发布！
Java微信小程序电商实战课程(95讲) 高调发布!
2024年粉丝福利 
http://download.java1234.com/
每月免费送 666 套Java海量资源网站 VIP会员，供大伙一起学Java
如果没加过锋哥微信的
加一下锋哥微信备注 666 即可开通
👇👇👇
👆长按上方二维码2秒,备注666

发表评论:取消回复

◎欢迎参与讨论，请在这里发表您的看法、交流您的观点。