【郑州校区】JDBC的批处理操作1.1.1 什么是批处理之前进行JDBC的操作的时候,都是一条SQL语句执行。现在如果使用批处理,可以将 ... 查看全文>>
1、原理以及现象分析1.1、数据倾斜怎么出现的在执行shuffle操作的时候,是按照key,来进行values的数据的输出、拉取和聚合的。 ... 查看全文>>
Hadoop原理架构本人就不在此赘述了,可以自行百度,本文仅介绍Hadoop-3.1.2完全分布式环境搭建(本人使用三个虚拟机搭建)。 ... 查看全文>>
Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集 ... 查看全文>>
我最近在用spark程序过滤数据,文件大概有700G。但是当我用累加器统计过滤掉多少数据时,程序就会报错。错误如下:WARN schedul ... 查看全文>>