Java 热门面试题-01

最近更新：2025-06-20 | 字数总计：6.1k

说说 Java 中 HashMap 的原理？

A: HashMap 是基于哈希表实现的，它使用键（key）的哈希值来确定存储位置。当我们向 HashMap 中添加一个键值对时，它会计算键的哈希值，并将键值对存储在相应的位置。当我们从 HashMap 中获取一个值时，它会计算键的哈希值，并在相应的位置查找值。
HashMap 中的每个位置称为一个桶（bucket），每个桶可以存储一个键值对。当我们向 HashMap 中添加一个键值对时，如果计算出的哈希值与某个桶的哈希值相同，那么这个键值对就会存储在这个桶中。如果计算出的哈希值与某个桶的哈希值不同，那么这个键值对就会存储在另一个桶中。

Java 中 ConcurrentHashMap 1.7 和 1.8 之间有哪些区别？

A: ConcurrentHashMap 1.7 和 1.8 之间有以下区别：

数据结构：ConcurrentHashMap 1.7 使用分段锁（Segment）来实现并发控制，而 ConcurrentHashMap 1.8 使用 CAS 和 synchronized 来实现并发控制。
扩容：ConcurrentHashMap 1.7 在扩容时，会将原数组中的元素重新计算哈希值，并将元素存储在新的数组中。而 ConcurrentHashMap 1.8 在扩容时，会将原数组中的元素重新计算哈希值，并将元素存储在新的数组中。
锁粒度：ConcurrentHashMap 1.7 使用分段锁来实现并发控制，每个分段锁控制一个桶，因此锁的粒度比较小。而 ConcurrentHashMap 1.8 使用 CAS 和 synchronized 来实现并发控制，因此锁的粒度比较大。
性能：ConcurrentHashMap 1.8 在并发控制方面性能更好，因为它使用 CAS 和 synchronized 来实现并发控制，而不是使用分段锁。

为什么 JDK 1.8 对 HashMap 进行了红黑树的改动？

A: JDK 1.8 对 HashMap 进行了红黑树的改动是为了提高 HashMap 的性能。在 JDK 1.8 之前，HashMap 使用链表来存储元素，如果链表过长，那么查找元素的时间就会变得很长。而 JDK 1.8 对 HashMap 进行了红黑树的改动，当链表过长时，HashMap 会将链表转换为红黑树，这样查找元素的时间就会变得很短。

JDK 1.8 对 HashMap 除了红黑树还进行了哪些改动？

A: JDK 1.8 对 HashMap 除了红黑树还进行了以下改动：

扩容：JDK 1.8 对 HashMap 的扩容进行了优化，当链表长度大于等于 8 时，HashMap 会将链表转换为红黑树。
链表长度：JDK 1.8 对 HashMap 的链表长度进行了优化，当链表长度大于等于 8 时，HashMap 会将链表转换为红黑树。
扩容因子：JDK 1.8 对 HashMap 的扩容因子进行了优化，当负载因子大于等于 0.75 时，HashMap 会进行扩容。
扩容时机：JDK 1.8 对 HashMap 的扩容时机进行了优化，当负载因子大于等于 0.75 时，HashMap 会进行扩容。

Java 中有哪些集合类？请简单介绍

A: Java 中有以下集合类：

List：List 是有序的集合，可以存储重复的元素。List 有以下实现类：ArrayList、LinkedList、Vector。
Set：Set 是无序的集合，不可以存储重复的元素。Set 有以下实现类：HashSet、LinkedHashSet、TreeSet。
Map：Map 是键值对的集合，不可以存储重复的键。Map 有以下实现类：HashMap、LinkedHashMap、TreeMap。
Queue：Queue 是队列，是一种先进先出（FIFO）的数据结构。Queue 有以下实现类：LinkedList、PriorityQueue。
Stack：Stack 是栈，是一种后进先出（LIFO）的数据结构。Stack 有以下实现类：Stack。

MySQL 索引的最左前缀匹配原则是什么？

A: MySQL 索引的最左前缀匹配原则是指，当我们在查询时，MySQL 会从左到右依次匹配索引的列。如果我们在查询时只匹配了索引的一部分，那么 MySQL 就会使用索引进行查询。如果我们在查询时匹配了索引的全部列，那么 MySQL 就会使用索引进行查询。

数据库的脏读、不可重复读和幻读分别是什么？

A: 数据库的脏读、不可重复读和幻读分别是什么？

脏读：脏读是指，当一个事务读取了另一个事务未提交的数据时，就会发生脏读。脏读会导致数据不一致。
不可重复读：不可重复读是指，当一个事务读取了另一个事务已提交的数据时，就会发生不可重复读。不可重复读会导致数据不一致。
幻读：幻读是指，当一个事务读取了另一个事务已提交的数据时，就会发生幻读。幻读会导致数据不一致。

在数据库事务中，脏读（Dirty Read）、不可重复读（Non-Repeatable Read） 和 幻读（Phantom Read） 是三种常见的并发问题。它们通常发生在多个事务并发执行时，由于隔离级别设置不当而导致的数据不一致问题。以下是它们的详细说明：

1. 脏读（Dirty Read）

定义

脏读是指一个事务读取了另一个事务尚未提交的数据。

场景

事务 A 修改了某条数据，但尚未提交。
事务 B 读取了事务 A 修改后的数据。
如果事务 A 回滚，事务 B 读取的数据就是无效的（即“脏数据”）。

示例

-- 事务 A
BEGIN;
UPDATE users SET balance = balance - 100 WHERE id = 1; -- 修改数据，未提交

-- 事务 B
BEGIN;
SELECT balance FROM users WHERE id = 1; -- 读取未提交的数据

影响

事务 B 读取了事务 A 未提交的数据，可能导致数据不一致。

2. 不可重复读（Non-Repeatable Read）

定义

不可重复读是指在一个事务内，多次读取同一数据，但由于其他事务的修改，导致读取结果不一致。

场景

事务 A 读取了某条数据。
事务 B 修改了该数据并提交。
事务 A 再次读取该数据时，发现数据已经改变。

示例

-- 事务 A
BEGIN;
SELECT balance FROM users WHERE id = 1; -- 第一次读取，结果为 1000

-- 事务 B
BEGIN;
UPDATE users SET balance = balance - 100 WHERE id = 1; -- 修改数据
COMMIT;

-- 事务 A
SELECT balance FROM users WHERE id = 1; -- 第二次读取，结果为 900
COMMIT;

影响

事务 A 在同一个事务内读取同一数据时，结果不一致，可能导致逻辑错误。

3. 幻读（Phantom Read）

定义

幻读是指在一个事务内，多次查询同一范围的数据，但由于其他事务的插入或删除操作，导致查询结果集不一致。

场景

事务 A 查询某个范围内的数据。
事务 B 插入或删除了该范围内的数据并提交。
事务 A 再次查询时，发现结果集中多出了新数据或少了数据。

示例

-- 事务 A
BEGIN;
SELECT * FROM users WHERE age BETWEEN 20 AND 30; -- 第一次查询，返回 2 条记录

-- 事务 B
BEGIN;
INSERT INTO users (name, age) VALUES ('Alice', 25); -- 插入新数据
COMMIT;

-- 事务 A
SELECT * FROM users WHERE age BETWEEN 20 AND 30; -- 第二次查询，返回 3 条记录
COMMIT;

影响

事务 A 在同一个事务内查询同一范围时，结果集不一致，可能导致逻辑错误。

4. 隔离级别与并发问题

数据库通过设置不同的隔离级别来控制并发问题的发生：

隔离级别	脏读	不可重复读	幻读
读未提交（Read Uncommitted）	可能	可能	可能
读已提交（Read Committed）	不可能	可能	可能
可重复读（Repeatable Read）	不可能	不可能	可能
串行化（Serializable）	不可能	不可能	不可能

读未提交：最低隔离级别，允许脏读。
读已提交：避免脏读，但允许不可重复读和幻读。
可重复读：避免脏读和不可重复读，但允许幻读（MySQL 的 InnoDB 通过 MVCC 避免了幻读）。
串行化：最高隔离级别，完全避免脏读、不可重复读和幻读，但并发性能最差。

5. 如何解决这些问题

提高隔离级别：通过设置更高的隔离级别（如可重复读或串行化）来避免这些问题。
使用锁机制：通过行锁、表锁或间隙锁来防止其他事务修改数据。
使用 MVCC（多版本并发控制）：如 MySQL 的 InnoDB 引擎通过 MVCC 避免了幻读。

总结

脏读：读取未提交的数据。
不可重复读：同一事务内多次读取同一数据，结果不一致。
幻读：同一事务内多次查询同一范围，结果集不一致。

通过合理设置隔离级别和使用锁机制，可以有效避免这些并发问题，确保数据的一致性和完整性。

MySQL 的存储引擎有哪些？它们之间有什么区别？

A: MySQL 的存储引擎有以下几种：

InnoDB：InnoDB 是 MySQL 的默认存储引擎。InnoDB 支持事务，支持行级锁，支持外键。
MyISAM：MyISAM 是 MySQL 的早期存储引擎。MyISAM 不支持事务，不支持行级锁，不支持外键。
Memory：Memory 是 MySQL 的内存存储引擎。Memory 存储引擎将数据存储在内存中，速度非常快。
Archive：Archive 是 MySQL 的归档存储引擎。Archive 存储引擎将数据存储在归档文件中，速度非常快。
CSV：CSV 是 MySQL 的 CSV 存储引擎。CSV 存储引擎将数据存储在 CSV 文件中，速度非常快。
Federated：Federated 是 MySQL 的联邦存储引擎。Federated 存储引擎将数据存储在其他 MySQL 服务器中。

MySQL 的覆盖索引是什么？

A: MySQL 的覆盖索引是指，当我们在查询时，只需要从索引中读取数据，而不需要从表中读取数据时，就会发生覆盖索引。覆盖索引会提高查询的性能。

MySQL 的索引类型有哪些？

A: MySQL 的索引类型有以下几种：

B+ 树索引：B+ 树索引是 MySQL 的默认索引类型。B+ 树索引支持范围查询，支持等值查询，支持排序查询。
哈希索引：哈希索引是 MySQL 的早期索引类型。哈希索引不支持范围查询，不支持等值查询，不支持排序查询。
全文索引：全文索引是 MySQL 的早期索引类型。全文索引支持全文搜索，支持模糊查询。
空间索引：空间索引是 MySQL 的早期索引类型。空间索引支持空间查询，支持空间数据类型。

MySQL 的索引下推是什么？

A: MySQL 的索引下推是指，当我们在查询时，MySQL 会先从索引中读取数据，然后再从表中读取数据。MySQL 的索引下推可以减少从表中读取数据的次数，提高查询的性能。

MySQL InnoDB 引擎中的聚簇索引和非聚簇索引有什么区别？

A: MySQL InnoDB 引擎中的聚簇索引和非聚簇索引有以下区别：

聚簇索引：聚簇索引是指，数据和索引存储在一起。聚簇索引的叶子节点存储的是数据。
非聚簇索引：非聚簇索引是指，数据和索引分开存储。非聚簇索引的叶子节点存储的是数据的指针。

MySQL 中的回表是什么？

A: MySQL 中的回表是什么？

回表是指，当我们在查询时，MySQL 会先从索引中读取数据，然后再从表中读取数据。MySQL 的回表可以减少从表中读取数据的次数，提高查询的性能。

MySQL 中使用索引一定有效吗？如何排查索引效果？

A: MySQL 中使用索引一定有效吗？如何排查索引效果？

MySQL 中使用索引不一定有效。如果我们的查询条件不匹配索引，那么 MySQL 就会使用全表扫描。
我们可以使用 EXPLAIN 语句来排查索引效果。EXPLAIN 语句可以帮助我们了解 MySQL 的查询计划。

RabbitMQ 怎么实现延迟队列？

A: RabbitMQ 怎么实现延迟队列？

RabbitMQ 可以使用延迟队列。延迟队列是指，消息在指定的时间后才会被消费。
我们可以使用 RabbitMQ 的延迟队列插件来实现延迟队列。延迟队列插件可以帮助我们实现延迟队列。

MySQL 中的索引数量是否越多越好？为什么？

A: MySQL 中的索引数量是否越多越好？为什么？

MySQL 中的索引数量是否越多越好？不一定。如果我们的查询条件不匹配索引，那么 MySQL 就会使用全表扫描。
我们可以使用 EXPLAIN 语句来排查索引效果。EXPLAIN 语句可以帮助我们了解 MySQL 的查询计划。

为什么 RocketMQ 不使用 Zookeeper 作为注册中心呢？而选择自己实现 NameServer？

A: 为什么 RocketMQ 不使用 Zookeeper 作为注册中心呢？而选择自己实现 NameServer？

RocketMQ 不使用 Zookeeper 作为注册中心是因为，Zookeeper 的性能比较差。
RocketMQ 选择自己实现 NameServer 是因为，RocketMQ 的 NameServer 是一个轻量级的组件。

请详细描述 MySQL 的 B+ 树中查询数据的全过程

A: MySQL 的 B+ 树中查询数据的全过程如下：

在 MySQL 中，B+ 树是 InnoDB 存储引擎用于索引数据的主要数据结构。B+ 树是一种平衡树，具有高效的查找、插入和删除操作。以下是 MySQL 中 B+ 树查询数据的详细过程：

1. B+ 树的基本结构

B+ 树是一种多路搜索树，具有以下特点：

节点分为内部节点和叶子节点：
- 内部节点存储键值和指向子节点的指针。
- 叶子节点存储键值和对应的数据（或指向数据的指针）。
叶子节点通过指针连接成链表，支持范围查询。
所有叶子节点位于同一层，确保查询效率稳定。

2. 查询数据的全过程

假设我们要查询一个键值为 k 的数据，以下是详细过程：

步骤 1：从根节点开始

B+ 树的查询从根节点开始。
根节点可以是内部节点或叶子节点（如果树只有一层）。

步骤 2：在内部节点中查找

对于内部节点，使用二分查找或顺序查找确定 k 所在的区间。
内部节点存储的键值用于划分子树的范围。例如，一个节点包含键值 [k1, k2, k3]，则：
- 如果 k < k1，进入第一个子树。
- 如果 k1 ≤ k < k2，进入第二个子树。
- 以此类推。
根据查找结果，进入对应的子节点。

步骤 3：递归查找

重复步骤 2，直到到达叶子节点。
由于 B+ 树是平衡的，每次查找都会将搜索范围缩小到一个子树，确保查找路径长度一致。

步骤 4：在叶子节点中查找

到达叶子节点后，使用二分查找或顺序查找定位键值 k。
如果找到 k，则返回对应的数据（或数据指针）。
如果未找到 k，则说明查询的数据不存在。

步骤 5：返回结果

如果查询的是主键索引（聚簇索引），叶子节点直接存储数据行。
如果查询的是二级索引（非聚簇索引），叶子节点存储主键值，需要回表查询主键索引以获取完整数据。

3. 范围查询的处理

B+ 树的叶子节点通过指针连接成链表，因此范围查询（如 WHERE id BETWEEN 10 AND 20）非常高效：

首先定位到键值 10 所在的叶子节点。
从该节点开始，沿着链表向后遍历，直到找到键值 20 或超出范围。

4. 查询的复杂度

时间复杂度：B+ 树的查询复杂度为 O(log n)，其中 n 是索引中的键值数量。
I/O 复杂度：B+ 树的设计尽量减少磁盘 I/O 次数。每次查找通常只需要访问 O(log m n) 个节点（m 是节点的分支因子）。

5. 示例

假设有一个 B+ 树索引，结构如下：

1
2
3

        [10, 20]
       /    |    \
[5, 7]  [15, 18]  [25, 30]

查询键值 18 的过程：

从根节点 [10, 20] 开始，发现 10 ≤ 18 < 20，进入第二个子树 [15, 18]。
在叶子节点 [15, 18] 中找到 18，返回对应的数据。

6. 优化查询性能

索引覆盖：如果查询的字段都在索引中，可以直接从索引中获取数据，避免回表。
减少磁盘 I/O：通过调整 B+ 树的节点大小（如 InnoDB 的页大小），减少磁盘访问次数。
使用合适的索引：为查询条件创建合适的索引，避免全表扫描。

通过以上过程，MySQL 利用 B+ 树高效地完成了数据查询。B+ 树的平衡性和多路分支特性使其非常适合数据库索引的场景。

RabbitMQ 中消息什么时候会进入死信交换机？

A: 在 RabbitMQ 中，死信交换机（Dead Letter Exchange, DLX） 是一种用于处理无法被正常消费的消息的机制。当消息满足某些条件时，它会被标记为“死信”（Dead Letter），并被重新路由到死信交换机，进而进入死信队列。以下是消息进入死信交换机的几种常见情况：

1. 消息被拒绝（Rejected）

当消费者明确拒绝消息（调用 basic.reject 或 basic.nack）并且设置了 requeue=false 时，消息不会被重新放回队列，而是成为死信。

示例：

1 2	basic.reject(deliveryTag, requeue=false) basic.nack(deliveryTag, multiple=false, requeue=false)

2. 消息过期（TTL 过期）

如果消息设置了 TTL（Time-To-Live，生存时间），并且在队列中等待的时间超过了 TTL，消息会过期并成为死信。
TTL 可以通过以下两种方式设置：

消息级别的 TTL：为单条消息设置过期时间。

AMQP.BasicProperties properties = new AMQP.BasicProperties.Builder()
    .expiration("60000") // 60秒
    .build();
channel.basicPublish(exchange, routingKey, properties, body);

队列级别的 TTL：为整个队列设置消息的过期时间。

1
2
3

Map<String, Object> args = new HashMap<>();
args.put("x-message-ttl", 60000); // 60秒
channel.queueDeclare(queueName, durable, exclusive, autoDelete, args);

3. 队列达到最大长度

如果队列设置了最大长度（通过 x-max-length 参数），当队列中的消息数量超过该限制时，最早的消息会被丢弃或成为死信。

示例：

1
2
3

Map<String, Object> args = new HashMap<>();
args.put("x-max-length", 100); // 队列最多存储 100 条消息
channel.queueDeclare(queueName, durable, exclusive, autoDelete, args);

4. 队列被删除

如果消息所在的队列被删除，队列中的未处理消息会成为死信。

5. 消息无法路由到队列

如果消息被发送到一个交换机，但无法路由到任何队列（例如，没有匹配的绑定规则），并且设置了 mandatory=true，消息会被视为死信。

示例：

1	channel.basicPublish(exchange, routingKey, true, properties, body);

6. 消息被手动标记为死信

在某些情况下，可以通过手动方式将消息标记为死信，例如在消费者逻辑中显式地将消息重新发布到死信交换机。

死信交换机的配置

要使用死信交换机，需要在队列声明时指定以下参数：

x-dead-letter-exchange：指定死信交换机的名称。
x-dead-letter-routing-key（可选）：指定死信的路由键。

示例：

Map<String, Object> args = new HashMap<>();
args.put("x-dead-letter-exchange", "dlx.exchange"); // 死信交换机名称
args.put("x-dead-letter-routing-key", "dlx.routing.key"); // 死信路由键
channel.queueDeclare(queueName, durable, exclusive, autoDelete, args);

死信的处理流程

消息满足上述条件之一，成为死信。
RabbitMQ 将死信重新发布到指定的死信交换机。
死信交换机根据绑定规则将消息路由到死信队列。
消费者可以从死信队列中消费这些消息，进行进一步处理（例如记录日志、重试或报警）。

使用场景

消息重试机制：将处理失败的消息放入死信队列，稍后重试。
延迟队列：通过 TTL 和死信交换机实现延迟消息处理。
异常处理：集中处理无法正常消费的消息，避免消息丢失。

通过合理配置死信交换机，可以更好地管理和处理异常消息，提高系统的可靠性和健壮性。

为什么 MySQL 选择使用 B+ 树作为索引结构？

MySQL 选择使用 B+ 树作为索引结构，主要是因为 B+ 树在数据库系统中具有多方面的优势，能够很好地满足数据库的查询、插入、删除和范围查询等操作的需求。以下是 MySQL 选择 B+ 树作为索引结构的主要原因：

1. 高效的查询性能

平衡树结构：B+ 树是一种平衡树，所有叶子节点位于同一层，确保查询的时间复杂度稳定在 O(log n)。
适合磁盘 I/O：B+ 树的节点大小通常与磁盘页大小（如 16KB）对齐，减少磁盘 I/O 次数，提高查询效率。

2. 支持范围查询

叶子节点链表：B+ 树的叶子节点通过指针连接成链表，非常适合范围查询（如 BETWEEN、>、< 等操作）。
示例：查询 WHERE id BETWEEN 10 AND 20，只需定位到起始键值，然后沿着链表遍历即可。

3. 适合大规模数据

多路分支：B+ 树是一个多路搜索树，每个节点可以存储大量键值和指针，减少树的高度，从而减少查询时的磁盘访问次数。
示例：一个三层 B+ 树可以轻松支持数千万甚至数亿条数据的索引。

4. 高效的插入和删除

自平衡特性：B+ 树在插入和删除操作后能够自动保持平衡，避免树结构退化（如退化为链表）。
节点分裂与合并：B+ 树通过节点的分裂和合并来维护平衡，这些操作的开销相对较小。

5. 适合磁盘存储

顺序访问优势：B+ 树的叶子节点形成有序链表，适合磁盘的顺序读取，减少随机 I/O。
节点大小优化：B+ 树的节点大小通常与磁盘页大小匹配，最大化利用磁盘块的存储空间。

6. 支持聚簇索引

数据与索引结合：InnoDB 存储引擎使用 B+ 树实现聚簇索引，将数据行直接存储在叶子节点中，减少查询时的磁盘访问次数。
二级索引优化：二级索引的叶子节点存储主键值，通过 B+ 树快速定位主键，再通过聚簇索引获取数据。

7. 对比其他数据结构的优势

与二叉搜索树（BST）对比

BST 的树高度较高，查询时间复杂度为 O(log n)，但磁盘 I/O 次数较多。
B+ 树通过多路分支减少树高度，更适合磁盘存储。

与哈希索引对比

哈希索引适合等值查询，但不支持范围查询。
B+ 树支持等值查询和范围查询，适用场景更广。

与 B 树对比

B 树的键值和数据分布在所有节点中，而 B+ 树的数据只存储在叶子节点中。
B+ 树的叶子节点形成链表，更适合范围查询和顺序访问。

8. 实际应用中的优势

事务支持：InnoDB 存储引擎使用 B+ 树实现事务的隔离性和一致性。
并发控制：B+ 树的结构适合实现行级锁和多版本并发控制（MVCC）。

总结

MySQL 选择 B+ 树作为索引结构，主要是因为 B+ 树在查询性能、范围查询、插入删除效率、磁盘 I/O 优化等方面具有显著优势。它能够很好地满足数据库系统对高效存储和检索的需求，同时支持事务和并发控制等高级特性。因此，B+ 树是 MySQL 实现索引的理想选择。

2025-02-08 该篇文章被 up 打上标签: Java 面试题