2021年4月21日
        
        
        
        
        
            一、相关资料 CDH文档 https://docs.cloudera.com/documentation/enterprise/latest/topics/impala.html 官方文档 http://impala.apache.org/downloads.html Impala3.4对接Iceberg在网易的最新实践 Impala3……
        
        阅读全文
    
    
    
        
        
            2021年4月21日
        
        
        
        
        
            一、flink on yarn执行流程 Flink任务提交后,Client向HDFS上传Flink的Jar包……
        
        阅读全文
    
    
    
        
        
            2020年12月22日
        
        
        
        
        
            1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50……
        
        阅读全文
    
    
    
        
        
            2020年12月22日
        
        
        
        
        
            1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50……
        
        阅读全文
    
    
    
        
        
            2020年12月21日
        
        
        
        
        
            spark学习之路 Spark学习之路 (一)Spark初识 Spark学习之路 (二)Spark2.3 HA……
        
        阅读全文
    
    
    
        
        
            2020年12月19日
        
        
        
        
        
            1.rdd的属性 一组分片(Partition),即数据集的基本组成单位。对于RDD来说,每个分片都会……
        
        阅读全文
    
    
    
        
        
            2020年4月7日
        
        
        
        
        
            一、文件 1. 文件是由大量性质相同对记录组成对集合.按其记录对类型不同而分成两类:操作系统对文件和数据库……
        
        阅读全文
    
    
    
        
        
            2020年4月7日
        
        
        
        
        
            一、外部排序: 指的是大文件的排序,待排序的记录存储在外存储器上,需要进行内外存交换。 外部存储设备:磁……
        
        阅读全文
    
    
    
        
        
            2020年4月7日
        
        
        
        
        
            一、内部排序 1. 排序sorting是计算机程序设计中的一种重要操作,它的功能是将一个数据元素或记录的任……
        
        阅读全文