MySQL 使用 JPA + Hibernate 的 9 个高性能技巧

本文由码农网 – 小峰原创翻译,转载请看清文末的转载要求,欢迎参与我们的付费投稿计划

介绍

尽管有SQL标准,但每个关系数据库终将是唯一的,因此你需要调整数据访问层,以便充分利用在使用中的关系数据库。

在本文中,我们将介绍在使用带有JPA和Hibernate的MySQL时,为了提高性能,我们可以做哪些事情。

不要使用AUTO标识符GeneratorType

每个实体都需要标识符,标识符惟一地标识与该实体关联的表记录。JPA和Hibernate允许根据三种不同的策略自动生成实体标识符:

  • IDENTITY
  • SEQUENCE
  • TABLE

正如我在这篇文章中所解释的,当增加数据库连接数时,TABLE标识符策略不会缩放。而且,即使是一个数据库连接,标识符生成响应时间比使用IDENTITY或SEQUENCE大十倍。

如果你使用AUTO GenerationType

@Id
@GeneratedValue(strategy = GenerationType.AUTO)
private Long id;

Hibernate 5将会退回到使用TABLE生成器,这对性能不利。

正如我在这篇文章中所解释的,你可以使用以下映射轻松解决此问题:

@Id
@GeneratedValue(strategy= GenerationType.AUTO, generator="native")
@GenericGenerator(name = "native", strategy = "native")
private Long id;

本地生成器将选择IDENTITY而不是TABLE。

IDENTITY生成器禁用JDBC批处理插入

MySQL 5.7和8.0都不支持SEQUENCE对象,因此你需要使用IDENTITY。但是,正如我在这篇文章中所解释的,IDENTITY生成器可以防止Hibernate使用JDBC批量插入。

JDBC批量更新和删除不受影响,只有INSERT语句不能被批处理,因为在Persistence Context被刷新之前,INSERT语句已被执行,从而Hibernate知道要分配给持久化实体什么实体标识符。

如果要解决此问题,则必须通过不同的框架,如jOOQ,执行JDBC批处理插入。

通过Docker和tmpfs加速集成测试

MySQL和MariaDB在不得不丢弃数据库模式的时候,以及每次新的集成测试即将运行因而重新创建它的时候,是非常慢的。但是,你可以在Docker和tmpfs的帮助下轻松解决此问题。

正如我在这篇文章中所解释的,通过映射内存中的数据文件夹,集成测试的运行速度将与有内存数据库(如H2或HSQLDB)时的速度相同。

对非结构化数据使用JSON

即使是在你使用RDBMS的时候,肯定也有很多次想要存储非结构化数据:

  • 来自客户端,如JSON的数据,需要被解析并插入到我们的系统中。
  • 可以缓存的图像处理结果以保存再处理

虽然本机不支持,但是你可以轻松地将Java对象映射到JSON列。甚至可以将JSON列类型映射到Jackson JsonNode。

更重要的是,你甚至不必编写这些自定义类型,可以从Maven Central中抓取:

<dependency>
    <groupId>com.vladmihalcea</groupId>
    <artifactId>hibernate-types-52</artifactId>
    <version>1.0.0</version>
</dependency>

很酷,对吧?

使用存储过程来保存数据库

在处理大量数据时,将所有数据移入和移出数据库并不是非常高效。不过,通过调用存储过程对数据库端进行处理会好很多。

有关更多详细信息,请参阅这篇有关如何调用带有JPA和Hibernate的MySQL存储过程的文章

小心ResultSet流

SQL流在两层应用程序中是很有意义的。如果你要执行ResultSet流,那么你也得注意JDBC驱动程序。在MySQL上,你需要将Statement大小设置为Integer.MIN_VALUE

然而,对于基于Web的应用程序,分页更为合适。JPA 2.2甚至引入了对Java 1.8 Stream方法的支持,但执行计划可能不如使用SQL级别分页时那么高效。

PreparedStatements可能会被仿真

你可能以为,既然Hibernate默认使用PreparedStatements,那么所有语句都是像这样执行的:

实际上,更像是这样执行的:

正如我在这篇文章中所解释的,除非你设置了useServerPrepStmts MySQL JDBC驱动程序属性,否则PreparedStatements将在JDBC驱动程序级别进行仿真以保存一个额外的数据库。

始终结束数据库事务

在关系数据库中,每个语句都在给定的数据库事务中执行。因此,事务是不可选的。

但是,你应该始终通过提交或回滚来结束当前正在运行的事务。忘记结束事务可能会导致持续被锁很长时间,同时也会阻止MVCC清理过程回收不再需要的旧元组或索引条目。

递交日期/时间没有那么容易

编程中有两件非常复杂的事情:

  • 处理编码
  • 处理跨多个时区的日期/时间

为了解决第二个问题,最好在UTC时区中保存所有时间戳。但是,当使用MySQL时,你还需要将useLegacyDatetimeCode JDBC Driver配置属性设置为false

结论

正如你所看到的,在使用带有JPA和Hibernate的MySQL时,要记住许多事情。因为MySQL是最为广泛部署的RDBMS之一,并被绝大多数的Web应用程序所使用,所以,了解所有这些技巧并调整数据访问层来最大限度地利用它非常有用。

译文链接:http://www.codeceo.com/article/mysql-jpa-hibernate-9-tips.html
英文原文:9 High-Performance Tips when using MySQL with JPA and Hibernate
翻译作者:码农网 – 小峰
转载必须在正文中标注并保留原文链接、译文链接和译者等信息。]