学习使用Apache Hive HIVE的作用将数据文件映射为一张表。将SQL语法解析编译成为MapReduce的执行程序。 HIVE的组件 1.用户接口 包括CLI,JDBC/ODBC、WebGUI。CLI(Command Line Interface)即命令行,是Hive的默认模式。HIVE中的Thrift服务器允许外部客户端通过网络与Hive交互,类似于JDBC或ODBC协议。(JDBC/ODBC即J 2024-05-08
数仓是什么? 数仓是什么?为了分析数据!数仓(Data Warehouse)是数据仓库的简称,是一种面向主题的、集成的、时变的、非易失的数据集合,用于支持管理决策。 数仓通常由数据仓库、数据集市和数据湖等组件组成,它们共同构成了一个完整的数据架构。数据仓库用于存储和分析历史数据,数据集市用于存储和分析特定主题的数据,数据湖则用于存储和分析所有类型的数据。 数仓的目的是提供一种统一的数据访问方式,使得企业能够方便 2024-05-06
网络和操作系统基础 网络基础三次握手过程客户端——发送带有SYN标志的数据包——服务端一次握手Client进入syn_sent状态;服务端——发送带有SYN/ACK标志的数据包——客户端二次握手服务端进入syn_rcvd;客户端——发送带有ACK标志的数据包——服务端三次握手连接就进入Established状态; 为什么三次:主要是为了建立可靠的通信信道,保证客户端与服务端同时具备发送、接收数据的能力。 为 2024-04-11