Hive---＞建立自定義的UDTF函式

飝鱻.發表於2020-11-27

原文網址 : https://blog.csdn.net/heiren_a/article/details/110236750

Hive--->建立自定義的UDTF函式

匯入依賴

只需要倒入一個依賴即可

    <dependencies>
        <dependency>
            <groupId>org.apache.hive</groupId>
            <artifactId>hive-exec</artifactId>
            <version>3.1.2</version>
        </dependency>
    </dependencies>

程式碼部分

import org.apache.hadoop.hive.ql.exec.UDFArgumentException;
import org.apache.hadoop.hive.ql.metadata.HiveException;
import org.apache.hadoop.hive.ql.udf.generic.GenericUDTF;
import org.apache.hadoop.hive.serde2.objectinspector.ObjectInspector;
import org.apache.hadoop.hive.serde2.objectinspector.ObjectInspectorFactory;
import org.apache.hadoop.hive.serde2.objectinspector.StructObjectInspector;
import org.apache.hadoop.hive.serde2.objectinspector.primitive.PrimitiveObjectInspectorFactory;

import java.util.ArrayList;
import java.util.List;

/**
 * 一進多出
 * 輸入資料：a,b,c,d
 * 輸出資料:a
 * b
 * c
 * d
 */
public class UDTFTest01 extends GenericUDTF {
    //輸出資料的集合
    private ArrayList<String> list = new ArrayList<>();

    //初始化方法
    @Override
    public StructObjectInspector initialize(StructObjectInspector argOIs) throws UDFArgumentException {
        //輸出資料的預設列名，可以被別名覆蓋
        List<String> names = new ArrayList<>();
        names.add("word");
        //輸出資料的型別
        List<ObjectInspector> fieldOIs = new ArrayList<>();
        fieldOIs.add(PrimitiveObjectInspectorFactory.javaStringObjectInspector);

        StructObjectInspector outputOI = ObjectInspectorFactory.getStandardStructObjectInspector(names, fieldOIs);
        return outputOI;
    }

    //處理輸入資料的方法
    @Override
    public void process(Object[] objects) throws HiveException {
        //提取輸出資料
        String input = objects[0].toString();
        String string = objects[1].toString();
        //分割
        String[] word = input.split(string);
        //遍歷陣列
        for (int i = 0; i < word.length; i++) {
            //清空集合
            list.clear();
            //將資料存入集合
            list.add(word[i]);
            //輸出集合
            forward(list);
        }
    }

    //收尾方法
    @Override
    public void close() throws HiveException {

    }
}

建立函式

將jar包傳入叢集
開啟hive並且匯入jar包（如果將jar包直接放入hive的lib目錄的話，這一步可忽略）add jar jar_path
在hive中建立函式create function function_name as 'class_path'function_name是為你自定義的函式取名，class_path是class檔案的路徑
如果不想使用可以刪除函式drop function function_name

FlinkSQL使用自定義UDTF函式行轉列-IK分詞器
2021-05-08
SQL函式分詞
matlab自定義函式建立與使用
2020-12-22
Matlab函式
Oracle 自定義函式
2018-10-21
Oracle函式
shell自定義函式
2020-04-05
函式
Hive常用函式及自定義函式
2018-06-08
Hive函式
工廠模式建立物件和自定義建構函式建立物件的異同
2019-03-01
模式物件函式
Houdini - 建立自定義的button樣式
2018-04-29
hive 3.0.0自定義函式
2018-09-06
Hive函式
Hive中自定義函式
2020-10-13
Hive函式
python教程：自定義函式
2024-07-04
Python函式
TDengine 3.0 中如何編譯、建立和使用自定義函式
2022-10-13
編譯函式
深入mysql建立自定義函式與儲存過程的詳解
2021-09-09
MySql函式儲存過程
java自定義equals函式和hashCode函式
2019-06-07
Java函式
PHP 自定義函式用法及常用函式集合
2019-08-02
PHP函式
Hive函式（內建函式+自定義標準函式UDF）
2020-09-23
Hive函式
Laravel 新增自定義助手函式
2020-05-29
Laravel函式
laravel 自定義全域性函式
2020-04-07
Laravel函式
Laravel 自定義函式存放位置
2020-04-26
Laravel函式
Laravel自定義輔助函式
2021-11-23
Laravel函式
FlinkSQL自定義函式開發
2023-03-31
SQL函式
HIVE自定義函式的擴充套件
2018-12-30
Hive函式套件
動畫函式的繪製及自定義動畫函式
2019-01-03
動畫函式
MySQL使用之五_自定義函式和自定義過程
2020-12-22
MySql函式
JavaScript 設計模式系列 – 自定義函式(惰性函式)
2019-02-28
JavaScript設計模式函式
Ignite自定義函式注意事項
2018-07-06
函式
VBA 自定義常用函式 (備用)
2020-03-30
函式
php自定義函式放哪兒
2022-05-13
PHP函式
MySQL全面瓦解18：自定義函式
2021-01-20
MySql函式
自定義跳轉函式的通用unhook方法
2022-05-06
函式Hook
在python中使用sqlite的自定義函式功能
2020-04-09
PythonSQLite函式
cmp是可選的自定義比較函式
2022-02-28
函式
Apache Phoenix自定義函式（UDF）實踐
2019-01-07
Apache函式
sql中select列有自定義函式 dblink
2018-05-26
SQL函式
Qt自定義動畫插值函式
2024-03-06
QT動畫函式
單據列表呼叫自定義SQL函式
2024-05-07
SQL函式
Excel vba自定義函式公式智慧提示
2024-08-18
Excel函式公式
22.python自定義函式（format，zip）
2024-08-08
Python函式ORM
Clickhouse 使用者自定義外部函式
2022-03-31
函式

Hive---＞建立自定義的UDTF函式

Hive--->建立自定義的UDTF函式

匯入依賴

程式碼部分

建立函式

相關文章