论文:Causal Structure Learning in Hawkes Processes with Complex Latent Confounder Networks 地址:https://openreview.net/forum?id=mA78uXqcnl
请各位同学给我点赞,激励我创作更好、更多、更优质的内容!^_^
关注微信公众号,获取更多资讯
二、核心理论基础
(一)多元霍克斯过程定义
由计数子过程集合N G = { N i } i = 1 l N_{G}=\{N_{i}\}_{i=1}^{l}NG={Ni}i=1l构成,N i ( t ) N_{i}(t)Ni(t)记录截至时间t tt的i ii类事件数。
子过程N i N_{i}Ni的强度函数为λ i ( t ) = μ i + ∑ j = 1 l ∫ 0 t ϕ i j ( t − s ) d N j ( s ) \lambda_{i}(t)=\mu_{i}+\sum_{j=1}^{l} \int_{0}^{t} \phi_{i j}(t-s) d N_{j}(s)λi(t)=μi+∑j=1l∫0tϕij(t−s)dNj(s),其中μ i \mu_{i}μi为背景强度,ϕ i j ( s ) \phi_{i j}(s)ϕij(s)为激发函数(衡量历史j jj类事件对后续i ii类事件的衰减影响)。
平稳性要求影响矩阵Φ \PhiΦ(元素Φ i j = ∫ 0 ∞ ϕ i j ( s ) d s \Phi_{i j}=\int_{0}^{\infty} \phi_{i j}(s) d sΦij=∫0∞ϕij(s)ds)的谱半径小于1。
部分观测多元霍克斯过程因果模型(PO-MHP):有向图G : = ( N G , E G ) G:=(N_{G}, E_{G})G:=(NG,EG),节点代表子过程(含p pp个观测节点O G O_{G}OG和q qq个潜在节点L G L_{G}LG),有向边E i j E_{i j}Eij存在当且仅当∫ 0 t ϕ i j ( t − s ) d N j ( s ) > 0 \int_{0}^{t} \phi_{i j}(t-s) d N_{j}(s)>0∫0tϕij(t−s)dNj(s)>0,允许循环和自环。
因果关系:若存在从N i N_{i}Ni到N j N_{j}Nj的有向路径,则N i N_{i}Ni是N j N_{j}Nj的原因,N j N_{j}Nj是N i N_{i}Ni的结果。
父因集:对N i N_{i}Ni,最小集合P G ⊆ N G ∖ { N i } P_{G} \subseteq N_{G}\setminus\{N_{i}\}PG⊆NG∖{Ni},所有从N G ∖ { N i } N_{G}\setminus\{N_{i}\}NG∖{Ni}到N i N_{i}Ni的有向路径均经过P G P_{G}PG,若N i N_{i}Ni有自环则自身也包含于P G P_{G}PG。
局部独立性:子过程N i N_{i}Ni在给定P G P_{G}PG时,与N G ∖ P G N_{G}\setminus P_{G}NG∖PG局部独立,当且仅当P G P_{G}PG是N i N_{i}Ni的父因集。
(三)连续时间到离散时间的转化
定理4.1(霍克斯过程作为线性自回归模型):当时间窗口大小Δ → 0 \Delta \to 0Δ→0时,平稳多元霍克斯过程可表示为线性自回归模型N i ( n ) = ∑ j = 1 l ∑ k = 1 n θ i j ( k ) N j ( n − k ) + ε i ( n ) + θ i ( 0 ) N_{i}^{(n)}=\sum_{j=1}^{l} \sum_{k=1}^{n} \theta_{i j}^{(k)} N_{j}^{(n-k)}+\varepsilon_{i}^{(n)}+\theta_{i}^{(0)}Ni(n)=∑j=1l∑k=1nθij(k)Nj(n−k)+εi(n)+θi(0),其中N i ( n ) N_{i}^{(n)}Ni(n)为第n nn个时间窗口的离散事件计数,θ i ( 0 ) = Δ ⋅ μ i \theta_{i}^{(0)}=\Delta \cdot \mu_{i}θi(0)=Δ⋅μi,θ i j ( k ) = ∫ ( k − 1 ) Δ k Δ ϕ i j ( s ) d s \theta_{i j}^{(k)}=\int_{(k-1) \Delta}^{k \Delta} \phi_{i j}(s) d sθij(k)=∫(k−1)ΔkΔϕij(s)ds,ε i ( n ) \varepsilon_{i}^{(n)}εi(n)为序列不相关的白噪声。
引理4.2(窗口图中的d-分离与秩约束):在PO-MHP的窗口因果图中,变量集C v C_{v}Cvd-分离A v A_{v}Av和B v B_{v}Bv,当且仅当交叉协方差矩阵∑ A v ∪ C v , B v ∪ C v \sum _{A_{v} \cup C_{v}, B_{v} \cup C_{v}}∑Av∪Cv,Bv∪Cv的秩等于∣ C v ∣ |C_{v}|∣Cv∣。
观测父因集识别(命题4.3):在PO-MHP中,观测子过程O 1 O_{1}O1的父因集P G P_{G}PG(子集于O G O_{G}OG),等价于窗口图中P G P_{G}PG对应滞后变量集P v P_{v}Pv是包含O 1 ( n ) O_{1}^{(n)}O1(n)所有父变量的最小集、d-分离O 1 ( n ) O_{1}^{(n)}O1(n)与其他变量、交叉协方差矩阵满足特定秩条件。
潜在混杂子过程识别
假设1(激发函数):ϕ i j ( s ) = a i j w ( s ) \phi_{i j}(s)=a_{i j} w(s)ϕij(s)=aijw(s),a i j a_{i j}aij为常数(衡量事件类型间影响),w ( s ) w(s)w(s)为仅依赖时滞的公共衰减函数(如指数衰减)。
对称无环路径场景(定义4.4):潜在混杂子L 1 L_{1}L1到观测效应子过程集O G 1 O_{G1}OG1的有向路径仅含中间潜在子过程、路径长度相同且无环,中间潜在子过程无自环。
命题4.5(从观测效应识别潜在混杂):在秩忠实性假设下,特定交叉协方差矩阵秩为2 m + 1 2m + 12m+1(m mm为有效滞后数),当且仅当存在潜在混杂子L 1 L_{1}L1(为O 1 , O 2 O_{1}, O_{2}O1,O2父因集成员),且L 1 L_{1}L1与O 1 , O 2 O_{1}, O_{2}O1,O2满足对称路径场景。
观测代理(定义4.6):为推断的潜在子过程L 1 L_{1}L1指定一个观测效应作为代理(如D e ( L 1 ) = O 1 De(L_{1})=O_{1}De(L1)=O1),S i b ( D e ( L 1 ) ) Sib(De(L_{1}))Sib(De(L1))为其他受L 1 L_{1}L1影响的观测子过程集。
计算复杂度:依赖子过程数量(含潜在混杂子)和因果图密度,Phase I复杂度上界为O ( n ! ∑ k = 1 m ( m k ) ) O(n! \sum_{k=1}^{m}\binom{m}{k})O(n!∑k=1m(km))(n nn为A G A_{G}AG中子过程数,m mm为增强过程集T G T_{G}TG中子过程数),Phase II复杂度上界为O ( ( n 2 ) ) O(\binom{n}{2})O((2n))。