Hiveいろいろ

hiveめも

Hive SQL

テーブル作成

CREATE TABLE [テーブル名] (名前 型,名前 型...)

パーティション

PARTITIONED BY (名前 型)

ファイルフォーマット

ROW FORMAT DELIMITED

    FIELDS TERMINATED BY '\t'

    LINES TERMINATED BY ' ' 

tsv形式
ファイル形式

STORED AS TEXTFILE 

デフォルトはtext

テーブルへファイルをロード

LOAD DATA LOCAL INPATH 'ファイルパス'

[OVERWIRTE] INTO TABLE テーブル名

[PARTITION (項目 = 値)]
  • Hiveのテーブル名、カラム名は全部小文字

  • loadの際、OVERWRITEの指定がない場合で同名ファイルがある場合「ファイル名copy~」みたいな形でコピーを作成し追記していく

  • ファイルフォーマットのデフォルトの区切り文字はCtrl+A