HDFS:InputFormat、OutputFormat与SerDe
Hadoop

HDFS:InputFormat、OutputFormat与SerDe

855 0

Hive中,默认使用的是TextInputFormat,一行表示一条记录。在每条记录一行中,默认使用^A分割各个字段。在有些时候,我们往往面对多行,结构化的文档,并需要将其导入Hive处理,此时,就需要自定义InputFormat、OutputFormat,以及SerDe了。首先来理清这三者之间的关...

阅读全文