Python之antlr-ast包语法、参数和实际应用案例-二趣网

Python antlr-ast 包：完整使用指南

一、包核心功能

antlr-ast是基于 ANTLR（强大的语法解析器生成器）的 Python 工具包，核心作用是：将任意文本（代码、配置、日志、DSL 等）按自定义语法解析为结构化抽象语法树（AST），并提供 AST 遍历、修改、转换、代码生成等能力。

核心定位：

替代手写正则/字符串解析，处理复杂、有语法规则的文本
兼容 ANTLR 所有语法规则，支持 100+ 编程语言/格式的现成语法文件
提供轻量 AST 操作接口，比原生 ANTLR 更易用、更贴合 Python 生态

核心能力：

语法文件编译：将.g4语法文件编译为 Python 解析器/词法分析器
文本解析：把输入文本转为可操作的 AST 节点树
AST 遍历：深度优先/广度优先遍历节点，提取/修改数据
节点操作：增删改 AST 节点、获取节点类型/文本/子节点
代码生成：将修改后的 AST 重新生成目标文本/代码

二、安装方法

1. 基础安装（Python 包）

pipinstallantlr-ast

2. 依赖安装（必须）

antlr-ast依赖 ANTLR 运行时，同时需要Java 环境（用于编译.g4语法文件）：

安装 ANTLR Python 运行时：

pipinstallantlr4-python3-runtime

安装 Java（JDK 8+）：
- Windows：Oracle JDK / OpenJDK
- Linux：sudo apt install openjdk-11-jdk
- Mac：brew install openjdk

3. 验证安装

importantlr_astprint(antlr_ast.__version__)# 输出版本号即安装成功

三、核心语法与参数

1. 核心工作流程（固定语法）

# 1. 导入依赖fromantlr_astimportAST,parse# 2. 解析文本为 AST（核心函数）ast=parse(input_text,# 输入文本grammar_name,# 语法名称（对应.g4文件）start_rule,# 起始语法规则（根节点）grammar_dir=".",# 语法文件所在目录cache=True# 缓存编译后的解析器（提升速度）)# 3. 操作 ASTast.tree# 获取根节点ast.children# 获取子节点列表ast.find("NodeType")# 查找指定类型节点ast.to_string()# 节点转文本ast.walk(callback)# 遍历所有节点

2. 核心函数参数详解

`parse()`核心参数

参数	类型	说明
`input_text`	str	待解析的原始文本（必填）
`grammar_name`	str	`.g4`语法文件名称（无后缀，必填）
`start_rule`	str	语法文件中的起始规则（必填）
`grammar_dir`	str	语法文件路径，默认当前目录
`cache`	bool	是否缓存解析器，默认 True
`encoding`	str	文件编码，默认 utf-8

AST 核心方法

方法	作用
`ast.children`	获取所有直接子节点
`ast.parent`	获取父节点
`ast.text`	节点对应的原始文本
`ast.type`	节点语法类型（来自语法文件）
`ast.find(type_name)`	递归查找所有指定类型的节点
`ast.find_first(type_name)`	查找第一个指定类型节点
`ast.walk(callback)`	遍历所有节点，执行回调函数
`ast.to_string()`	将节点（含子节点）还原为文本
`ast.replace(old_node, new_node)`	替换节点

四、8 个实际应用案例（可直接运行）

前置准备

所有案例需先创建对应.g4语法文件，语法文件是 ANTLR 的核心（定义文本解析规则）。

案例 1：解析简单数学表达式（入门）

步骤 1：创建语法文件`Expr.g4`

grammar Expr; start: expr; // 起始规则 expr: INT ('+'|'-'|'*'|'/') INT; // 表达式规则 INT: [0-9]+; // 整数定义 WS: [ \t\n]+ -> skip; // 忽略空格换行

步骤 2：Python 代码解析

fromantlr_astimportparse# 待解析的数学表达式text="100 + 200"# 解析为 ASTast=parse(input_text=text,grammar_name="Expr",start_rule="start")# 提取数据print("根节点类型:",ast.type)# startprint("表达式文本:",ast.text)# 100 + 200nodes=ast.find("INT")print(f"数字1:{nodes[0].text}, 数字2:{nodes[1].text}")

输出

根节点类型: start 表达式文本: 100 + 200 数字1: 100, 数字2: 200

案例 2：解析 JSON 配置文件

步骤 1：下载现成 JSON 语法文件

下载 JSON.g4 放到当前目录。

步骤 2：解析 JSON 文本

fromantlr_astimportparse# JSON 文本json_text=''' { "name": "antlr-ast", "version": "1.0.0", "author": "test" } '''# 解析 ASTast=parse(json_text,"JSON","json")# 提取所有键值对pairs=ast.find("pair")forpinpairs:key=p.find_first("STRING").text.strip('"')value=p.children[-1].textprint(f"{key}:{value}")

输出

name: "antlr-ast" version: "1.0.0" author: "test"

案例 3：解析 Nginx 配置文件

步骤 1：下载Nginx.g4

步骤 2：提取 Nginx 监听端口

fromantlr_astimportparse nginx_conf=''' server { listen 80; server_name localhost; root /var/www/html; } '''ast=parse(nginx_conf,"Nginx","start")listen_nodes=ast.find("ListenStatement")fornodeinlisten_nodes:port=node.find_first("Number").textprint(f"Nginx 监听端口:{port}")

输出

Nginx 监听端口: 80

案例 4：解析 Python 代码（提取函数）

步骤 1：下载Python3.g4

步骤 2：提取 Python 函数名

fromantlr_astimportparse code=''' def add(a, b): return a + b def sub(a, b): return a - b '''ast=parse(code,"Python3","start")funcs=ast.find("FuncDef")forfinfuncs:func_name=f.find_first("IDENTIFIER").textprint(f"函数名:{func_name}")

输出

函数名: add 函数名: sub

案例 5：日志结构化解析（自定义 DSL）

步骤 1：创建日志语法`Log.g4`

grammar Log; start: line+; line: '[' TIME ']' LEVEL ':' MSG; TIME: [0-9:]+; LEVEL: 'INFO'|'ERROR'|'WARN'; MSG: ~[\r\n]+; WS: [ \t] -> skip;

步骤 2：解析日志

fromantlr_astimportparse log=''' [12:30:45] INFO: 服务启动成功 [12:31:00] ERROR: 数据库连接失败 '''ast=parse(log,"Log","start")lines=ast.find("line")forlineinlines:time=line.find_first("TIME").text level=line.find_first("LEVEL").text msg=line.find_first("MSG").textprint(f"[{time}]{level}:{msg}")

案例 6：AST 节点修改 + 代码生成

fromantlr_astimportparse# 数学表达式修改text="10 + 20"ast=parse(text,"Expr","start")# 找到数字节点并修改nodes=ast.find("INT")nodes[0].text="100"# 10 → 100# 重新生成文本new_text=ast.to_string()print("修改后:",new_text)# 100 + 20

案例 7：批量解析 CSV 类自定义文本

# MyCSV.g4 grammar MyCSV; start: row+; row: FIELD (',' FIELD)* '\n'?; FIELD: [a-zA-Z0-9]+;

fromantlr_astimportparse csv='''name,age,city 张三,20,北京 李四,25,上海'''ast=parse(csv,"MyCSV","start")rows=ast.find("row")fori,rowinenumerate(rows):fields=[f.textforfinrow.find("FIELD")]print(f"第{i+1}行:",fields)

案例 8：SQL 查询语句解析（提取表名）

步骤 1：下载SQL.g4

步骤 2：解析 SQL

fromantlr_astimportparse sql="SELECT id, name FROM user WHERE age > 18"ast=parse(sql,"MySQL","query")# 提取表名table_nodes=ast.find("TableName")fortintable_nodes:print("查询表名:",t.text)

五、常见错误与解决方案

企业官网建设流程全解析

Python antlr-ast 包：完整使用指南

一、包核心功能

二、安装方法

1. 基础安装（Python 包）

2. 依赖安装（必须）

3. 验证安装

三、核心语法与参数

1. 核心工作流程（固定语法）

2. 核心函数参数详解

parse()核心参数

AST 核心方法

四、8 个实际应用案例（可直接运行）

前置准备

案例 1：解析简单数学表达式（入门）

步骤 1：创建语法文件Expr.g4

步骤 2：Python 代码解析

输出

案例 2：解析 JSON 配置文件

步骤 1：下载现成 JSON 语法文件

步骤 2：解析 JSON 文本

输出

案例 3：解析 Nginx 配置文件

步骤 1：下载Nginx.g4

步骤 1：下载Python3.g4

步骤 1：下载SQL.g4

热门文章

文章分类

标签云

相关文章

C++（贪心算法一）

Hermes Agent桌面版发布！Windows用户终于不用敲命令了

Python 爬虫项目 容器化部署爬虫项目基础教程

需要专业的网站建设服务？

`parse()`核心参数

步骤 1：创建语法文件`Expr.g4`

Python 爬虫项目容器化部署爬虫项目基础教程