Hiveいろいろ
hiveめも
Hive SQL
テーブル作成
CREATE TABLE [テーブル名] (名前 型,名前 型...)
パーティション
PARTITIONED BY (名前 型)
ファイルフォーマット
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\t'
LINES TERMINATED BY ' '
tsv形式
ファイル形式
STORED AS TEXTFILE
デフォルトはtext
テーブルへファイルをロード
LOAD DATA LOCAL INPATH 'ファイルパス'
[OVERWIRTE] INTO TABLE テーブル名
[PARTITION (項目 = 値)]
他
Hiveのテーブル名、カラム名は全部小文字
loadの際、OVERWRITEの指定がない場合で同名ファイルがある場合「ファイル名copy~」みたいな形でコピーを作成し追記していく
ファイルフォーマットのデフォルトの区切り文字はCtrl+A