大数据共19篇
专注于大数据技术的面试题,包括Hadoop、Spark等大数据处理框架的使用
【大数据】Kafka如何提升吞吐量?(约238字)-IT面试吧
【大数据】Flink跟Spark Streaming的区别(约301字)-IT面试吧
【大数据】Flink分布式快照的原理是什么?(约357字)-IT面试吧
【大数据】Kafka数据积压(约210字)-IT面试吧
【大数据】HDFS读流程和写流程(约223字)-IT面试吧
【大数据】Hadoop解决数据倾斜方法(约282字)-IT面试吧
【系列面试题】海量数据处理面试题(2)(约2439字)-IT面试吧

【系列面试题】海量数据处理面试题(2)(约2439字)

文章目录海量数据处理面试题# 6、如何查询最热门的查询串?# 题目描述# 解答思路# 方法一:分治法# 方法二:HashMap 法# 方法三:前缀树法# 方法总结# 7、如何统计不同电话号码的个数?# 题目描...
产品经理克星的头像-IT面试吧产品经理克星2个月前
020
【大数据】Flink集群有哪些角色?各自有什么作用?(约214字)-IT面试吧
【大数据】FlinkSQL怎么对SQL语句进行优化的?(约229字)-IT面试吧
【大数据】Kafka分区分配策略(约175字)-IT面试吧
【大数据】简单介绍一下 Flink?(约303字)-IT面试吧
【大数据】Yarn调度器有哪些?(约420字)-IT面试吧
【大数据】Kafka架构(约61字)-IT面试吧
【系列面试题】海量数据处理面试题(1)(约2637字)-IT面试吧

【系列面试题】海量数据处理面试题(1)(约2637字)

文章目录海量数据处理面试题# 1、如何从大量的 URL 中找出相同的 URL?# 解答思路# 1. 分治策略# 2. 前缀树# 方法总结# 分治策略# 前缀树# 2、如何从大量数据中找出高频词?# 题目描述# 解答思...
码农不秃头的头像-IT面试吧码农不秃头6个月前
000
【大数据】Hive优化(约646字)-IT面试吧
【大数据】SparkStreaming有哪几种方式消费Kafka中的数据,它们之间的区别是什么?(约688字)-IT面试吧
【大数据】Flume组成,Put事务,Take事务(约423字)-IT面试吧
【大数据】说说Flink中的窗口(分类、生命周期、触发、划分)(约300字)-IT面试吧
【大数据】Kafka过期数据清理(约224字)-IT面试吧