最近在进行旧版本的prestosql和prestodb升级相关的操作，尝试自己编译了一下，这里记录一下过程和遇到问题的处理。
因为Trino不支持windows下的编译，如果使用windows最方便的方式就是使用wsl了。

WSL中编译和调试

wsl的准备工作不累述了，升级到wsl2，使用的是ubuntu.
详见：
Windows Subsystem for Linux Installation Guide for Windows 10

工具安装

其他的过程包括安装java并设置一下JAVA_HOME(maven需要使用) ，maven和git之类。

sudo apt install openjdk-11-jdk

#如果之前有其他发行版
update-alternatives --list java

wget https://mirror.bit.edu.cn/apache/maven/maven-3/3.6.3/binaries/apache-maven-3.6.3-bin.tar.gz

sudo tar -xzvf apache-maven-3.6.3-bin.tar.gz  -C /opt/maven

idea同理，去官网下载然后移动到对应目录即可。
（本来想通过jetbrain-toolbox安装，但不知道为什么不能显示gui界面放弃了）

配置修改

修改一下/etc/profile

export JAVA_HOME=/usr/lib/jvm/java-11-openjdk-amd64
export M2_HOME=/opt/maven/apache-maven-3.6.3
export IDEA_HOME=/opt/idea/idea-IU-203.7148.57
export PATH=$M2_HOME/bin:$IDEA_HOME/bin:$PATH

xserver

为了方便xserver的配置，直接使用了mobaxterm，注意这里不用再去看网上的wsl的xserver设置，moba自己已经设置好了而且用的是和网上其他文档不同的port，自己设置了反而弹不出来。

在wsl中输入idea.sh即可弹出界面。
（这样简单设置无法使用外部的输入法，已经不支持外部剪切板（默认支持内部的复制到外部）

编译

默认的分支是最新版本的snapshot，需要切换到对应tag：

git fetch --all
git checkout tags/352

可以将wsl的maven的本地仓库路径设置到外部的仓库，这样就可以复用已有的不需要完全下载新的。

编译的方式和运行就按照trino仓库即可（见trino)，其中有一个文档是不需要编译的，且会比较耗时间，可以这么跳过：

mvn -pl '!docs' clean install -DskipTests

调试插件

启动命令在官网仓库中有，直接使用即可。

对于要调试的插件，将项目放入plugin目录中，默认是不会加载的，修改一下core/trino-server-main/etc/config.properties在plugin.bundles中加入自己项目的路径即可。（这里的加载插件很多，启动会比较慢可以适当减少一些）

升级遇到的问题

迁移的方法官网给了说明：Migrating from PrestoSQL to Trino
最主要的一点是在配置文件（$TRINO_HOME/etc/config.properties）中增加
protocol.v1.alternate-header-name=Presto 。

UDF升级过程还可以，不得不说API的兼容性还是很好的，升级包之后API都是兼容的只是修改了一下路径。
需要注意的是之前一直需要的那个io.trino.spi.Plugin文件不需要了，当前打包会自动生成，有了他反而会编译失败。

主要遇到了两个问题：@OutputFunction注解的内容解析方式改变了，新版的Trino使用了SqlBase.g4中type的语法。
我们之前的形式array(row(start timestamp,end timestamp))会解析失败，在插件load的时候会挂掉（服务启动失败），因为end是一个保留字。

io.trino.sql.parser.ParsingException: line 1:35: mismatched input 'end'. Expecting: <identifier>, <type>
	at io.trino.sql.parser.ErrorHandler.syntaxError(ErrorHandler.java:108)
	at org.antlr.v4.runtime.ProxyErrorListener.syntaxError(ProxyErrorListener.java:41)
	at org.antlr.v4.runtime.Parser.notifyErrorListeners(Parser.java:544)
	at org.antlr.v4.runtime.DefaultErrorStrategy.reportUnwantedToken(DefaultErrorStrategy.java:377)
	at org.antlr.v4.runtime.DefaultErrorStrategy.singleTokenDeletion(DefaultErrorStrategy.java:548)
	at org.antlr.v4.runtime.DefaultErrorStrategy.sync(DefaultErrorStrategy.java:266)
	at io.trino.sql.parser.SqlBaseParser.rowField(SqlBaseParser.java:11435)
	at io.trino.sql.parser.SqlBaseParser.type(SqlBaseParser.java:11103)
	at io.trino.sql.parser.SqlBaseParser.typeParameter(SqlBaseParser.java:11645)
	at io.trino.sql.parser.SqlBaseParser.type(SqlBaseParser.java:11329)
	at io.trino.sql.parser.SqlBaseParser.standaloneType(SqlBaseParser.java:404)
	at io.trino.sql.parser.SqlParser.invokeParser(SqlParser.java:139)
	at io.trino.sql.parser.SqlParser.createType(SqlParser.java:94)
	at io.trino.sql.analyzer.TypeSignatureTranslator.parseTypeSignature(TypeSignatureTranslator.java:98)
	at io.trino.operator.aggregation.AggregationImplementation$Parser.<init>(AggregationImplementation.java:315)
	at io.trino.operator.aggregation.AggregationImplementation$Parser.parseImplementation(AggregationImplementation.java:357)
	at io.trino.operator.aggregation.AggregationFromAnnotationsParser.parseFunctionDefinitions(AggregationFromAnnotationsParser.java:83)
	at io.trino.metadata.SqlAggregationFunction.createFunctionsByAnnotations(SqlAggregationFunction.java:45)
	at io.trino.metadata.FunctionExtractor.extractFunctions(FunctionExtractor.java:49)
	at io.trino.server.PluginManager.installPluginInternal(PluginManager.java:203)
	at io.trino.server.PluginManager.installPlugin(PluginManager.java:175)
	at io.trino.server.PluginManager.loadPlugin(PluginManager.java:169)
	at io.trino.server.PluginManager.loadPlugin(PluginManager.java:157)
	at io.trino.server.PluginManager.loadPlugins(PluginManager.java:143)

这部分的规则是这样组成的：

type
    : ROW '(' rowField (',' rowField)* ')'     <- 命中这条                                    #rowType
...  

rowField
    : type
    | identifier type; <- 命中这条  

identifier
    : IDENTIFIER             #unquotedIdentifier
    | QUOTED_IDENTIFIER      #quotedIdentifier
    | nonReserved            #unquotedIdentifier <- END不在这里
    | BACKQUOTED_IDENTIFIER  #backQuotedIdentifier
    | DIGIT_IDENTIFIER       #digitIdentifier
    ;

nonReserved
    // IMPORTANT: this rule must only contain tokens. Nested rules are not supported. See SqlParser.exitNonReserved
    : ADD | ADMIN | ALL | ANALYZE | ANY | ARRAY | ASC | AT | AUTHORIZATION
    | BERNOULLI
    | CALL | CASCADE | CATALOGS | COLUMN | COLUMNS | COMMENT | COMMIT | COMMITTED | CURRENT
    | DATA | DATE | DAY | DEFINER | DESC | DISTRIBUTED | DOUBLE
    | EXCLUDING | EXPLAIN
...  

END: 'END';

修改很简单，只需要end加上转义即可，变为了array(row(start timestamp,\"end\" timestamp))。
至此可以编译成功（类型挂掉的都是因为和解析不符）。

但运行使用这个UDF的sql会报错，这就是另一个问题了，timestamp的类型增加了。 timestamp(3)和timestamp不匹配，这个比较有意思，文档里说了timestamp是timestamp(3)的别名：

#TIMESTAMP
TIMESTAMP is an alias for TIMESTAMP(3) (millisecond precision).

但UDF里就是不能这么写，最后改为array(row(start timestamp(3),\"end\" timestamp(3)))。
至此问题解决。

现在还在测试中，UDF这些的文档有些欠缺了，自己摸索了一下发现还不如看源码来得直接，这部分的文档缺失的也厉害，写/改UDF基本也是靠已有的例子摸索。
其他的部分都还不错，兼容性也很好，可见Trino的社区支持还是很到位的，要感谢各位大佬的努力。

希望之后替换可以顺利吧~

Written with StackEdit.

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

windows(wsl)下的trino编译和升级注意事项

WSL中编译和调试

工具安装

配置修改

xserver

编译

调试插件

升级遇到的问题

您必须登录才能发表评论！

WSL中编译和调试

工具安装

配置修改

xserver

编译

调试插件

升级遇到的问题

您必须 登录 才能发表评论！

您必须登录才能发表评论！