조인 질의를 위한 효율적인 무작위 순서 열거를 향하여

Pengyu Chen

pchen.research@gmail.com Harbin Institute of Technology Harbin, China

Zizheng Guo

zguo.research@gmail.com Harbin Institute of Technology Zhengzhou Advanced Research Institute Zhengzhou, China

Jianwei Yang

yangjianwei006@cnpc.com.cn Harbin Institute of Technology Harbin, China

Dongjing Miao

miaodongjing@hit.edu.cn Harbin Institute of Technology Harbin, China

초록

많은 데이터 분석 파이프라인에서 기본적이면서도 시간이 많이 드는 과정은 조인 결과를 생성하여 이를 다운스트림 작업에 전달하는 것이다. 이를 위해 수많은 열거 알고리즘이 개발되어 왔다. 전체 조인 결과를 통계적으로 의미 있게 대표하려면, 결과 튜플은 균등한 무작위 순서로 열거되어야 한다. 그러나 기존 연구에는 (순환) 조인 질의에 대해 최악의 경우 실행 시간 보장을 갖는 효율적인 무작위 순서 열거 알고리즘이 부족하다. 본 논문에서는 복잡도에 큰 숨은 상수가 없는 효율적인 조인 질의용 무작위 순서 열거 알고리즘을 개발하여, $$ 𝑂 ( AGM (𝑄 )|𝑅𝑒𝑠 (𝑄 ) | log 2 |𝑄 |)

기댓값 지연과, $$ 𝑂 (AGM (𝑄 ) log |𝑄 |)

총 실행 시간, 그리고 $$ 𝑂 (| 𝑄 | log |𝑄 |)

이며, 여기서

𝑅𝑒𝑠 (𝑄 )는 조인 결과 집합이고 𝑑는 관계의 최대 차수이다). 또한 우리가 아는 한, 이러한 알고리즘들은 아직 구현되어 실험적으로 평가되지 않았다. 그러나 표본추출 기반 열거 방식은 실제로 많은 생성된 결과 튜플이 버려지기 때문에 시간을 크게 낭비한다. 또한 총 실행 시간에 대한 최악의 경우 보장이 없고, 알고리즘이 종료될 때 모든 결과 튜플을 출력할 수 있다는 엄밀한 보장도 없다. 엄밀히 말하면, 질의 결과 수에 대해 부분선형 지연을 갖는 열거 알고리즘으로조차 간주되지 않을 수 있다 [ 9]. 더 나쁘게도, 표본추출 기반 무작위 순서 열거는 기존 조인 표본추출 알고리즘의 앞서 언급한 약점을 그대로 물려받는다. 본 논문에서는 총 실행 시간에 대한 최악의 경우 보장을 제공하는 효율적인 조인 질의용 무작위 순서 열거 알고리즘을 제시한다. 이론적으로 우리의 알고리즘은 조인 결과 튜플을 기댓값 $$ 𝑂 ( AGM (𝑄 )|𝑅𝑒𝑠 (𝑄 ) |+ 1 log 2 |𝑄 |)

지연과

𝑂 (AGM (𝑄 ) log |𝑄 |)

총 실행 시간으로 열거하며, 그 전에 $$ 𝑂 (| 𝑄 | log |𝑄 |)

시간의 인덱스 구축 단계를 수행한다. 또한 이 알고리즘은 거의 최악의 경우 최적임이 증명되며, Generic Join [ 22 ]과 같은 몇몇 최악의 경우 최적 조인 알고리즘과 동일한 총 실행 시간 복잡도를 달성한다. 실용적으로는 열거를 가속하고 메모리 사용을 줄이기 위한 기법들을 개발했으며, 특히 AGM (𝑄 ) ≫ | 𝑅𝑒𝑠 (𝑄 )| 인 경우 실험에서 성능 향상을 크게 이끌어냈다. 우리의 알고리즘은 열거 지연과 총 실행 시간에 큰 상수나 다항로그 인자가 없는 거의 최적의 무작위 순서 열거 알고리즘일 뿐 아니라, 전처리 없는 효율적인 조인 표본추출 알고리즘으로도 사용될 수 있다. 즉, 관계 테이블 위에 구축한 인덱스는 서로 다른 조인 질의에서 재사용할 수 있으며, 각 질의마다 선형 시간 전처리를 다시 할 필요가 없다. 더욱이 우리의 알고리즘은 관계 테이블에 대해 복잡한 인덱스 구조를 요구하지 않는다. 균형 트리, B-tree, skip list, trie와 같이 데이터베이스 시스템에서 널리 사용되는 다양한 계층적 인덱싱 구조를 지원한다. 갱신이 필요하지 않은 경우에는 튜플을 사전식 순서로 정렬하는 것만으로도 가벼운 인덱싱 메커니즘으로 충분하다. 이러한 유연성 덕분에 우리의 알고리즘은 최소한의 개발 오버헤드로 다양한 데이터베이스 시스템에 통합될 수 있다. 구체적으로, 우리의 기여는 다음과 같다. 첫째, 새로운 개념인 RRAccess (Relaxed Random-Access 알고리즘)와 잘 조직된 자료구조인 Ban-Pick tree를 기반으로 조인 질의를 위한 효율적인 무작위 순서 열거 알고리즘 프레임워크를 개발한다. 이 두 개념은 본 논문에서 처음 제안된다. 구체적으로 RRAccess는 정수 집합 𝑆 (반드시 연속일 필요는 없음)에서 조인 결과 튜플 집합 𝑅𝑒𝑠 (𝑄 )로의 전단사 𝛼를 계산하도록 정의되며,

𝐼 ∩ 𝑆 = ∅ 를 만족하는 자명한 구간 𝐼 를 𝑆 에 속하지 않는 정수를 입력했을 때 반환한다. Ban-Pick tree는 금지 구간이라 불리는 서로소 구간들의 모음을 유지하며, 남아 있는(금지되지 않은) 구간들에서 균등 무작위로 정수를 뽑는 연산을 지원한다. Ban-Pick tree를 기반으로, 만약 $$ 𝑂 (log 2 |𝑄 |)

최악 시간과 $$ 𝑂 (log |𝑄 |)

상각 시간에 동작하고 ∀𝑠 ∈ 𝑆, 𝑠 ≤ AGM (𝑄 )를 만족하는 RRAccess 알고리즘이 있다면, 우리의 알고리즘은 𝑅𝑒𝑠 (𝑄 )의 결과 튜플을 기댓값 $$ 𝑂 ( AGM (𝑄 )|𝑅𝑒𝑠 (𝑄 ) |+ 1 log 2 |𝑄 |)

지연과

𝑂 (AGM (𝑄 ) log |𝑄 |)

총 실행 시간으로 열거함을 보인다. 그리고 그 기댓값 열거 지연과 총 실행 시간이 이론적 하한보다 다항로그 인자만큼만 크므로 거의 최악의 경우 최적 알고리즘임이 증명된다. 또한 우리의 프레임워크는 실제 환경에서 열거 효율을 크게 향상시키는 실용적인 가속 기법도 가능하게 한다. 둘째, relaxed random-access tree (RRATree)라 부르는 논리적 트리 구조에 기반한 RRAccess 알고리즘을 설계한다. RRATree의 각 노드는 하나의 필터에 대응하고, 부모 노드의 필터를 만족하는 결과 튜플 집합은 그 자식들의 필터에 대응하는 부분집합으로 재귀적으로 분할된다. RRATree의 필터 성질을 최대한 활용하여 효율적인 자료구조를 구축하고, 상한 추정 알고리즘과 자식 탐색 알고리즘을 개발하는데, 이 둘은 모두 $$ 𝑂 (log |𝑄 |)

시간에 동작한다. 이러한 구성 요소 덕분에 RRAccess는 $$ 𝑂 (log 2 |𝑄 |)

최악 시간과 $$ 𝑂 (log |𝑄 |)

상각 시간을 달성하고, 그 결과 거의 최악의 경우 최적 REnum을 얻는다. 또한 REnum의 메모리 사용을 분석하고, 실제 메모리 오버헤드를 줄이기 위한 세 가지 기법을 도입한다. 셋째, 우리의 알고리즘 프레임워크를 바탕으로 열거를 가속하기 위한 두 가지 비자명한 기법을 개발한다. 첫 번째는

larger trivial interval discovery (LTI)이다. N[1, AGM (𝑄 )] \ 𝛼 −1 (𝑅𝑒𝑠 (𝑄 )) 안의 자명 정수들은 종종 연속적이며 구간(자명 구간)으로 묶일 수 있다. LTI는 RRAccess 실행 중에 큰 자명 구간을 발견하여 후속 단계에서 더 많은 자명 정수를 뽑지 않도록 한다. 그 결과 RRAccess가 ⊥를 반환할 확률이 줄어들어 총 실행 시간과 열거 지연이 감소한다. RRAccess가 𝑝𝑒𝑟𝑝 를 반환할 확률을 더 줄이기 위해, tighter upper-bound estimation (TU)이라 부르는 두 번째 기법을 개발한다. TU는

890 RRATree의 각 필터에 대해 필터링된 조인 결과 수의 더 타이트한 상한 추정을 제공하므로, 더 많고 더 큰 자명 구간이 더 이른 시점에 발견되고 금지된다. 결과적으로 LTI의 효과가 향상된다. 마지막으로, 우리는 최적화 기법과 함께 우리 알고리즘의 효율성, 메모리 사용량, 확장성을 실험적으로 평가한다. 결과는 이러한 기법을 적용한 우리의 알고리즘이 표본추출 기반 방법 [13, 23]보다 현저히 우수함을 보여준다. 논문의 나머지 구성은 다음과 같다. 기본 표기와 필요한 몇 가지 기법은 Section 2에서 소개한다. Section 3에서는 우리의 핵심 무작위 순서 열거 알고리즘 프레임워크를 소개한다. Section 4에서는 RRATree와 RRAccess 알고리즘을 자세히 설명하고, 열거 지연과 총 실행 시간의 경계를 수립하며, 메모리 절감 기법을 제시한다. Section 5에서는 실제로 열거를 크게 가속하는 비자명한 기법들을 논의한다. Section 6에서는 실험 연구를 제시한다. 지면 제약으로 인해 일부 증명과 세부 사항은 생략하며 기술 보고서 [11]에 제공한다.

2 기초

본 논문에서 모든 정수의 집합은 Z로, 모든 자연수의 집합은 N으로 표기한다. 임의의 자연수 𝑖 와 𝑗 에 대하여

𝑖 ≤ 𝑗 이면, N[𝑖, 𝑗 ] = [𝑖, 𝑗 ] ∩ N으로 정의한다.

2.1 조인 질의

유한한 속성 집합 Att와 𝑈 ⊆ Att가 주어졌을 때, 𝑈 위의 튜플은 함수 𝑡 : 𝑈 → Z이고, 튜플 𝑡 의 𝑉 ⊆

𝑈 에 대한 사영, 즉 𝑡 [𝑉 ]는 각 𝑣 ∈

𝑉 에 대해 𝑡 [𝑉 ] ( 𝑣 ) = 𝑡 (𝑣 )를 만족하는 튜플이다. 관계 𝑅 은 동일한 속성 집합

𝑈 위의 튜플들의 집합이며, att (𝑅 ) = 𝑈 라고 하자. 그러면 조인 질의 𝑄 는 관계들의 집합 {𝑅 1, . . . , 𝑅 𝑚 }로 정의되며, 𝑄 = 𝑅 1⋈︁ · · · ⋈︁ 𝑅 𝑚 로 표현할 수 있다. 그리고 |𝑄 | =∑︁ 𝑚 𝑖 =1 |𝑅 𝑖 |를 𝑄 안 관계들의 크기 합으로 둔다

(즉 입력의 크기). 질의 𝑄 의 결과는

Res (𝑄 ) := {𝑡 over att (𝑄 )|∀ 𝑅 ∈ 𝑄 : 𝑡 [att (𝑅 )] ∈ 𝑅 }, where att (𝑄 ) =⋃︁

𝑅 ∈𝑄

att (𝑅 ) 로 정의된다. 속성

𝑣 의 활성 도메인을 dom 𝑄 (𝑣 )로 두면,

즉, dom 𝑄 (𝑣 ) =⋃︁ 𝑅 ∈𝑄 ⋃︁ 𝑣 ∈att (𝑅 ) {𝑡 (𝑣 )| 𝑡 ∈ 𝑅 } 이고, 따라서

Res (𝑄 ) ⊆ ∏︁ 𝑣 ∈att (𝑄 ) dom 𝑄 (𝑣 ) 이다.

2.2 AGM 경계

직관적으로 AGM 경계는 실제 데이터 값을 알 필요 없이 입력 관계들의 기수만으로 조인 결과가 얼마나 커질 수 있는지에 대한 상한을 제공한다. 이는 조인 결과의 “최악의 경우” 크기를 특징짓고, 질의 평가의 잠재적 비용을 추정하고 효율적인 조인 알고리즘을 설계하는 데 널리 사용된다. 형식적으로, 조인 질의 𝑄 가 주어졌을 때, 𝑄 의 스키마 그래프는 hypergraph 𝐺 𝑄 =

(𝑉 , 𝐸 )로 정의되며, 여기서 𝑉 = att (𝑄 )이고 𝐸 = {att (𝑅 )| 𝑅 ∈ 𝑄 }이다. 𝑐 : 𝐸 → ( 0, 1)

를 𝐺 𝑄 의 분수 간선 덮개라고 하자. 즉, ∀𝑣 ∈ 𝑉 ,∑︁ 𝑣 ∈𝑒 𝑐 (𝑒 ) ≥ 1. 그러면

|Res (𝑄 )| ≤ AGM 𝑐 (𝑄 ) [2], where AGM 𝑐 (𝑄 ) :=∏︁ 𝑅 ∈𝑄 |𝑅 |𝑐 (att (𝑅 ) ) .또한 𝐸𝐶 (𝐺 𝑄 )를 𝐺 𝑄 의 모든 분수 간선 덮개의 집합이라 하면, 𝑄 의 최소화된 AGM 경계, 즉 AGM (𝑄 ) =

min 𝑐 ∈𝐸𝐶 (𝐺 𝑄 ) AGM 𝑐 (𝑄 ), 는 타이트하다. 즉 |Res (𝑄 ∗)| = Ω(AGM (𝑄 ∗))를 만족하는 조인 질의 𝑄 ∗가 존재한다 [ 2]. AGM 경계는 관계 테이블의 크기만으로도 효율적으로 계산할 수 있으며, 최소화된 AGM 경계는 데이터 복잡도 하에서 선형계획법을 풀어 $$ 𝑂 (1)

시간에 계산할 수 있다는 점에 유의하라. 𝑥 𝑦 𝑧 𝑆 𝑅 𝑇 > (a) 𝐺 𝑄 Δ 𝑥 𝑦 1 22 33 44 1 > (b) 𝑅 𝑦 𝑧 1 33 44 44 1 > (c) 𝑆 𝑥 𝑧 2 43 13 44 2 > (d) 𝑇 𝑥 𝑦 𝑧 2 3 43 4 13 4 4 > (e) 𝑅𝑒𝑠 (𝑄 Δ) Table 1: 𝑄 Δ := 𝑅 ⋈︁ 𝑆 ⋈︁ 𝑇 ## 2.3 균등 표본추출 조인 표본추출 알고리즘은 각 조인 결과 튜플을 동일한 확률로 출력한다. 형식적으로, 조인 표본추출 알고리즘은 입력으로 조인 질의 𝑄 를 받고 𝑅𝑒𝑠 (𝑄 ) 안의 튜플을 출력하는 무작위화 알고리즘 G이며, \forall𝑡 \in Res (𝑄 )에 대해 Pr (G( 𝑄 ) outputs 𝑡 ) = 1 > |Res (𝑄 ) | 를 만족한다. Deng 등 [ 13 ]에 따르면, (복잡도 가설 하에서) 거의 최악의 경우 최적인 조인 표본추출 알고리즘이 존재한다. Theorem 1 ([ 13 ]). There is a uniform join sampling algorithm running in expected $$ 𝑂 ˜ ( AGM (𝑄 ) > max {1,|𝑅𝑒𝑠 (𝑄 ) | } )

time after a $$ 𝑂 ˜ (| 𝑄 |)

-time index construction phase. Moreover, under the combinatorial 𝑘 -clique hypothesis, for any 𝜀 > 0, there is no uniform sampling algorithm for join queries that runs in $$ 𝑂 ˜ (| 𝑄 | + |𝑄 |𝜌 * -𝜀 > |Res (𝑄 ) | )

time with high probability, where 𝜌 ∗ is the fractional edge cover number of 𝐺 𝑄 .

2.4 무작위 순서 열거

조인 질의를 위한 무작위 순서 열거 알고리즘은 조인 질의 𝑄 를 입력으로 받아 Res (𝑄 )의 모든 튜플을 무작위 순서로 출력하는 무작위 알고리즘이다. 다시 말해, 각 1 ≤ 𝑖 <

|Res (𝑄 )| 에 대해, 처음 𝑖 개의 결과 튜플 𝑡 1, . . . , 𝑡 𝑖 가 출력된 후, (𝑖 + 1)번째 출력 결과 튜플은 Res (𝑄 ) \ {𝑡 1, . . . , 𝑡 𝑖 }의 균등 표본이다. 모든 결과 튜플이 출력된 뒤에도 알고리즘은 더 이상의 튜플이 남아 있지 않음을 확인하기 위해 추가 계산이 필요할 수 있다는 점에 유의하라. 무작위 순서 열거 알고리즘의 (기댓값) 열거 지연은 다음 시간 구간들의 최대 (기댓값) 길이로 정의된다: (1) 알고리즘 시작부터 첫 번째 결과 튜플이 출력될 때까지의 시간, (2) 임의의 결과 튜플 출력부터 다음 결과 튜플 출력까지의 시간, (3) 마지막 결과 튜플 출력부터 알고리즘 종료까지의 시간.

3 열거 프레임워크 개요

이 절에서는 효율적인 무작위 순서 열거 알고리즘 프레임워크를 개발한다. 알고리즘을 직관적으로 설명하기 위해, 먼저 대표적인 순환 조인 질의 𝑄 Δ를 정의하고, 이를 이후 논의 전반에서 예시로 사용할 것이다.

Example 1 ( 𝑄 Δ). Let 𝑄 △ := 𝑅 ⋈︁ 𝑆 ⋈︁ 𝑇 , in which att (𝑅 ) =

{𝑥, 𝑦 }, att (𝑆 ) = {𝑦, 𝑧 } and att (𝑇 ) = {𝑥, 𝑧 }. The schema graph, rela-tion tables, and join results of 𝑄 Δ are shown in Table 1.

무작위 순서 열거를 위한 자연스러운 아이디어는 연속된 자연수 집합 N[1, |Res (𝑄 Δ)|]

과 결과 튜플 집합 Res (𝑄 Δ) 사이의 전단사를 구축하는 것이다. 예를 들어, Res (𝑄 Δ)𝜋 (𝑖 )를 사전식 순서 𝜋 에서 Res (𝑄 Δ) 의 𝑖 번째 튜플이라 하자. 그러면 𝑅𝑒𝑠 (𝑄 Δ)의 무작위 순서 열거는

891 𝑖 = 1, . . . , |Res (𝑄 Δ)| 에 대해 Res (𝑄 Δ)𝜋 (𝜎 (𝑖 ))를 나열함으로써 얻을 수 있으며, 여기서 𝜎는 1부터 |Res (𝑄 Δ)| 까지의 정수에 대한 무작위 순열이다. 예를 들어 Example 1에서 정수의 무작위 순열이 2, 3, 1이면, 열거되는 튜플은 (3, 4, 1), (3, 4, 4), (2, 3, 4)가 된다. 이 접근은 [ 9]에서 보이듯 비순환 조인 질의에는 작동하며, 거기서는 선형 시간 전처리 후 다항로그 시간에 계산 가능한 그러한 전단사를 제시한다. 그러나 일반적인 조인 질의, 특히 순환 조인 질의의 경우, 특정 복잡도 가설 하에서는 이렇게 효율적으로 계산 가능한 전단사가 존재하지 않는다 [9]. 우리의 접근에서는 전단사 구성 요구를 완화한다. 대신 정의역의 일부 정수는 어떤 결과 튜플에도 대응하지 않도록 허용하고, 이를 “ ⊥”에 매핑한다. 우리는 이러한 정수를 “자명 정수”라 하고, 나머지를 “비자명 정수”라 부른다. 주어진 정수가 자명한지 여부는 효율적으로 검사할 수 있다. 주목할 점은 모든 비자명 정수와 결과 튜플 사이의 대응은 전단사라는 것이다. 따라서 복원 없이 정수를 균등 무작위로 표본추출하고, 표본추출된 순서대로 비자명 정수에 대응하는 튜플을 출력하면, 조인 결과의 올바른 무작위 순서 열거를 얻는다. 효율을 더 높이기 위해, 자명 정수를 만나면 그 정수가 속한 자명 구간을 식별하고 기록한다. 자명 구간이 발견되어 기록되면, 그 안의 정수들은 후속 단계에서 더 이상 표본추출되지 않는다. 이 절의 나머지 부분에서는 (1) 정수와 조인 결과 사이의 매핑에 대한 형식적 정의와 이를 계산하는 알고리즘(즉 relaxed random-access 알고리즘), (2) 온라인 구간 금지와 금지되지 않은 정수의 균등 표본추출을 지원하는 새로운 자료구조(즉 Ban-Pick tree), (3) (1)과 (2)에 기반한 효율적인 무작위 순서 열거 알고리즘 프레임워크를 소개한다.

3.1 Relaxed Random-Access 알고리즘

함수족 𝜑 ={︁ 𝜑 𝑄 |𝑄 ∈ Q }︁ 와 조인 질의 𝑄 가 주어졌다고 하자.

𝜑 𝑄 : N+ → Res (𝑄 ) ∪ {⊥} 는 각 튜플 𝑡 ∈ Res (𝑄 )

에 대해 오직 하나의 𝑖 ∈ N+, 𝜑 𝑄 (𝑖 ) = 𝑡 가 존재하는 성질을 만족한다. 또한 𝑁 을

|Res (𝑄 )| 의 상한으로 두고, ∀𝑖 > 𝑁 , 𝜑 𝑄 (𝑖 ) =⊥를 만족한다고 하자. 우리는 {𝑖 |𝜑 ∗ (𝑖 ) =⊥} 안의 정수들, 즉 자명 정수들이 종종 연속적이며 구간(자명 구간)으로 묶일 수 있음을 관찰했다. 특히 AGM (𝑄 ) ≫ | 𝑅𝑒𝑠 (𝑄 )| 인 경우 그러하다. 가능한 한 많은 자명 정수가 선택되는 것을 방지하기 위해, relaxed random-access 알고리즘은 자명 구간을 보고한다. 형식적으로 RRAccess 𝑄,𝜑 를 정수 𝑖 를 입력받아 다음과 같이 동작하는 알고리즘으로 정의한다: (1) 𝜑 𝑄 (𝑖 ) ≠⊥이면 𝜑 𝑄 (𝑖 )를 반환하고, (2) 그렇지 않으면 𝑎 ≤

𝑖 ≤ 𝑏 를 만족하는, 자명 정수만 포함하는 자명 구간 [𝑎, 𝑏 ] ⊆ N+ 를 반환한다. Section 4에서 우리는 $$ 𝑂 (log 2 |𝑄 |)

최악 시간과

𝑂 (log |𝑄 |)

상각 시간에 동작하는 relaxed random-access 알고리즘의 구현을 소개할 것이다. ## 3.2 Ban-Pick Tree 이미 선택되었거나 어떤 조인 결과에도 대응하지 않는 정수를 반복해서 선택하지 않기 위해, 그러한 정수를 나타내는 구간들의 모음을 동적으로 유지하고, 이를 이후 선택에서 제외한다. 구체적으로 우리는 두 종류의 정수를 정의한다: (1) 어떤 조인 결과에도 대응하지 않는 자명 정수, (2) 이전 단계에서 이미 선택된 선택 정수. 우리는 이러한 구간들이 서로소인 집합 𝐵 를 Ban-Pick tree라 부르는 자료구조를 사용해 유지한다. 이 구조와 두 연산은 새로 선택된 정수가 𝐵 의 어떤 구간에도 속하지 않음을 보장한다. 형식적으로 Ban-Pick tree는 다음 두 연산을 가능하게 한다: (1) 금지 연산 𝑩.𝒃𝒂𝒏 은 𝐵 의 모든 구간과 서로소인 구간을 입력받아 이를 𝐵 에 삽입한다. (2) 선택 연산 𝑩.𝒑𝒊𝒄𝒌 은 ∀𝐼 ∈ 𝐵, 𝐼 ⊆ [ 1, 𝐻 ]를 만족하는 정수 𝐻 를 입력받아 𝑖 ∈ [ 1, 𝐻 ] \ ∪ 𝐼 ∈𝐵 𝐼 를 균등 무작위로 반환한다. Ban-Pick tree를 기반으로 하면 𝐵 의 금지 구간 안에 있는 자명 정수와 선택 정수는 다시 선택되지 않게 된다. 일반적으로 N[1, 𝑁 ] \ ⋃︁ 𝐼 ∈𝐵 𝐼 는 연속 구간이 아니다. 이 때문에 하나의 구간에서 동작하는 단순 생성기는 실패한다. 따라서 우리는 서로소 구간들의 합집합 위에서 동작하는 pick 연산을 제공해야 한다. 𝐵 = {𝐼 𝑖 = [𝑙 𝑖 , ℎ 𝑖 ]| 𝑖 ∈ N[1, |𝐵 |]} 를 이미 금지된 서로소 구간들의 집합이라 하자. 일반성을 잃지 않고 ℎ𝑖 < 𝑙 𝑖 +1 가 모든 𝑖 ∈ N[1, |𝐵 | − 1]에 대해 성립한다고 하자. 𝐿 = |N[1, 𝑁 ] \ ∪ |𝐵 | > 𝑖 =1 𝐼 𝑖 |, 즉 𝐿 = 𝑁 −∑︁ |𝐵 | > 𝑖 =1 |𝐼 𝑖 | 라 하자. 우리의 pick 연산은 다음과 같이 동작한다: (1) 정수 𝑦 ∈ N[1, 𝐿 ]를 균등 무작위로 표본추출하고, (2) 오프셋 𝑏 =∑︁ 𝑘 ∗ > 𝑖 =1 |𝐼 𝑖 | 를 계산하되, ℎ𝑘 ∗ < 𝑦 + 𝑏 이고 𝑦 + 𝑏 < 𝑙 𝑘 ∗+1 (if 𝑘 ∗ < |𝐵 |)를 만족하게 하며, (3) 𝑦 + 𝑏 를 반환한다. Step (2)에서 오프셋을 효율적으로 계산하기 위해, Ban-Pick tree를 균형 트리 𝑇 𝐵 로 정의한다. 이 트리는 (1) 각 노드 𝑢 ∈ 𝑇 𝐵 가 하나의 구간 𝐼 𝑢 = [𝑢.𝑙, 𝑢.ℎ ] ∈ 𝐵 와 전단사로 대응하고, 𝑢.𝑙 과 𝑢.ℎ 를 통해 이를 저장한다. (2) 각 노드 𝑢 ∈ 𝑇 𝐵 는 왼쪽 자식과 오른쪽 자식을 가리키는 𝑢. left 와 𝑢. right 를 유지하며, 𝑣 가 𝑢 의 왼쪽(오른쪽) 자식이면 𝑣.ℎ < 𝑢.𝑙 (𝑣.𝑙 > 𝑢.ℎ ) 이다. (3) 각 노드 𝑢 ∈ 𝑇 𝐵 는 𝑢. take 를 유지하는데, 이는 𝑢 를 루트로 하는 부분트리에 있는 구간 길이들의 합을 나타낸다. (4) 𝑇 𝐵 의 높이는 $$ 𝑂 (log |𝐵 |)

이다.

Algorithm 1: 𝐵.𝑝𝑖𝑐𝑘

Input: 𝐻

Output: a uniform sample from N[1, 𝐻 ] \ ∪ 𝐼 ∈𝐵 𝐼

1

𝑢 ← the root of 𝑇 𝐵 ;

2

sample an integer 𝑦 ∈ N[1, 𝐻 − 𝑢.𝑡𝑎𝑘𝑒 ] uniformly;

3

𝑏 ← 0, temp ← 0;

4

while 𝑢 ≠ nil do

5

if 𝑢. left = nil then temp ← 0;

6

else temp ← 𝑢. left .take ;

7

if (𝑦 + 𝑏 ) + temp < 𝑢.𝑙 then 𝑢 ← 𝑢. left ;

8

else 𝑏 ← 𝑏 + temp + ( 𝑢.ℎ − 𝑢.𝑙 + 1), 𝑢 ← 𝑢. right ;

9

return 𝑦 + 𝑏

그러면 ban 연산은 각 구간 삽입에 대해 $$ 𝑂 (log |𝐵 |)

시간이 걸린다. 또한 우리는 Algorithm 1과 같이 𝐵.𝑝𝑖𝑐𝑘 의 효율적 구현을 설계한다. 알고리즘은 개념적으로 N[1, 𝐻 ]의 금지되지 않은 원소들을 하나의 “압축된 가용 공간” N[1, 𝐻 − 𝑟 .𝑡𝑎𝑘𝑒 ]로 이어붙인 것으로 본다. 여기서 𝑟 는 𝑇 𝐵 의 루트이다. 먼저 N[1, 𝐻 − 𝑟 .𝑡𝑎𝑘𝑒 ]에서 무작위 정수 𝑦 를 균등하게 표본추출한 다음, 892 𝑇 𝐵 를 순회하여 위치 𝑦 에 대응하는 금지되지 않은 구간을 찾고, 그 앞선 모든 금지 구간 길이의 총합과 같은 오프셋 𝑏 를 계산한다. 마지막으로 알고리즘은 𝑦 +𝑏 를 반환하는데, 이는 원래 공간 N[1, 𝐻 ]\∪ 𝐼 ∈𝐵 𝐼 에서의 매핑된 값이다. 예를 들어 𝐻 = 8이고 𝐵 = {[ 2, 3], [6, 6]} 라고 하자. 금지되지 않은 구간은 [1, 2], [4, 5], [7, 8]이고, 이들의 이어붙임은 압축된 가용 공간 N[1, 5]를 이룬다. 만약 N[1, 5]에서 𝑦 = 4가 표본추출되면, 이는 세 번째 금지되지 않은 구간 [7, 8]에 대응한다. 따라서 알고리즘은 𝑦 + 𝑏 = 4 + (|[ 2, 3]| + |[ 6, 6]|) = 7 을 반환한다. 𝑇 𝐵 의 높이는 최대 $$ 𝑂 (log |𝐵 |)

이므로, Algorithm 1은

𝑂 (log |𝐵 |)

시간에 동작한다. 또한 𝑦 는 압축된 가용 공간에서 균등하게 표본추출되므로, 특정 금지되지 않은 구간에 대응할 확률은 그 크기에 비례하고, 𝑦 + 𝑏 는 그 구간 내에서 균등 분포를 따른다. 따라서 Algorithm 1은 집합 N[1, 𝐻 ] \ ⋃︁ 𝐼 ∈𝐵 𝐼 로부터 균등 표본을 생성한다.

비고. Ban-Pick tree는 기본 데이터 저장 및 접근 메커니즘과 독립적이므로, 코드 수정 없이 다양한 데이터베이스 시스템에 통합될 수 있다.

3.3 열거 프레임워크

임의의 조인 질의 𝑄 가 주어졌을 때, ∀𝑖 > 𝑁 , 𝜑 𝑄 (𝑖 ) =⊥를 만족하는 |Res (𝑄 )|의 상한 𝑁 을 두자. Algorithm 2는 [1, 𝑁 ] \ 𝐵 에서 정수를 균등 무작위로 반복 선택함으로써 Res (𝑄 )의 모든 튜플을 열거한다.

여기서 𝐵 는 자명 정수와 선택 정수를 포함하는 금지 구간들의 집합이다. 선택된 각 정수 𝑖 는 RRAccess 𝑄,𝜑 에 전달된다. 만약 𝜑 𝑄 (𝑖 ) ≠⊥이면, 즉 RRAccess 𝑄,𝜑 가 유효한 결과 튜플을 반환하면, 알고리즘은 그 튜플을 출력하고 중복을 피하기 위해 [𝑖, 𝑖 ]를 𝐵 에 삽입한다. 반대로 𝜑 𝑄 (𝑖 ) =⊥이면, 즉 𝑖 가 RRAccess 𝑄,𝜑 가 반환한 자명 구간 𝐼 안에 있음을 뜻하면, 알고리즘은 그 전체 구간 𝐼 를 𝐵 에 삽입한다. 이 과정은 각 결과 튜플이 정확히 한 번만 출력됨을 보장한다. 또한 각 단계에서 출력되는 튜플(존재한다면)은 아직 열거되지 않은 조인 결과의 집합에서 균등하게 표본추출된다.

Algorithm 2: REnum

Input: 𝑄

Output: Res (𝑄 ) in a random order

1

𝐵 ← ∅ , 𝑁 ban ← 0;

2

while 𝑁 ban < 𝑁 do

3

𝑖 ← 𝐵.𝑝𝑖𝑐𝑘 (𝑁 );

4

𝑟𝑒𝑠 ← RRAccess 𝑄,𝜑 ∗ (𝑖 );

5

if 𝑟𝑒𝑠 is a tuple in Res (𝑄 ) then

6

output 𝑟𝑒𝑠 ;

7

𝐵.𝑏𝑎𝑛 ([ 𝑖, 𝑖 ]) , 𝑁 ban ← 𝑁 ban + 1;

8

else 𝐵.𝑏𝑎𝑛 (𝑟𝑒𝑠 ), 𝑁 ban ← 𝑁 ban + | 𝑟𝑒𝑠 |;

Lemma 1. For any 𝑄 ∈ Q, if log 𝑁 ≤ $$ 𝑂 (log |𝑄 |)

and there exists a relaxed random-access algorithm 𝑅𝑅𝐴𝑐𝑐𝑒𝑠𝑠 𝑄,𝜑 running in

𝑂 (log 2 |𝑄 |)

worst-case time and $$ 𝑂 (log |𝑄 |)

amortized time, then Al-gorithm 2 enumerates the tuples in Res (𝑄 ) in random order with expected $$ 𝑂 ( 𝑁

|Res (𝑄 ) |+ 1

log 2 |𝑄 |)

delay and $$ 𝑂 (𝑁 log |𝑄 |)

total time.

𝑁 ≤ AGM (𝑄 )인 경우, 즉 Lemma 1의 RRAccess 𝑄,𝜑 가 ∀𝑖 > AGM (𝑄 ), 𝜑 (𝑖 ) =⊥를 만족하는 경우, Algorithm 2는 조인 결과를 기댓값 $$ 𝑂 ( AGM (𝑄 )|Res (𝑄 ) |+ 1 log 2 |𝑄 |)

지연과 $$ 𝑂 (AGM (𝑄 ) log |𝑄 |)

총 실행 시간으로 무작위 순서 열거한다. 여기서 𝜌 ∗는 𝐺 𝑄 의 분수 간선 덮개 수이다. 또한 [ 13 ]에 의해 $$ 𝑂 (AGM (𝑄 ) log |𝑄 |)

총 실행 시간은 조합적 𝑘 -clique 가설이 거짓이 아닌 한 최악의 경우 거의 최적이다. 더 나아가, 처음 열거된 결과 튜플은 𝑅𝑒𝑠 (𝑄 )에서의 균등 표본이므로, 조인 표본추출 알고리즘의 기댓값 실행 시간 하한은 무작위 순서 열거 알고리즘의 기댓값 지연 하한이기도 하다. 형식적으로 다음 정리가 성립한다. Theorem 2. Under the combinatorial 𝑘 -clique hypothesis, for any 𝜀 > 0, there is no random-order enumeration algorithm for join queries with expected $$ 𝑂 ˜ ( |𝑄 |𝜌 * -𝜀 > |Res (𝑄 ) |+ 1 )

delay after a $$ 𝑂 ˜ (| 𝑄 |)

-time preprocessing, where 𝜌 ∗ is the minimal fractional edge cover number of 𝐺 𝑄 . 이 정리는 $$ 𝑂 ˜ (| 𝑄 |)

시간 전처리 후, 기댓값 $$ 𝑂 ( AGM (𝑄 )|Res (𝑄 ) |+ 1 log 2 |𝑄 |) ≤ 𝑂 ( |𝑄 |𝜌 ∗

|Res (𝑄 ) |+ 1

log 2 |𝑄 |)

인 지연이 거의 최적임을 뜻한다. ## 4 RELAXED RANDOM-ACCESS 이 절에서는 $$ 𝑂 (log 2 |𝑄 |)

최악 시간과 $$ 𝑂 (log |𝑄 |)

상각 시간을 달성하는 RRAccess 의 효율적인 구현을 제시한다. 이어서 결과로 얻어지는 REnum 알고리즘을 분석하고, 공간 사용량을 줄이는 기법들을 소개한다. 이러한 보장을 달성하기 위해 RRAccess 는 relaxed random-access tree (RRATree) 라 부르는 개념적 트리 구조, 즉 𝑇 ˜ 𝑄 를 기반으로 구축된다. ## 4.1 RRATree와 RRAccess 개요 직관적으로 RRATree는 조인 질의의 활성 도메인을 재귀적으로 분할하는 개념적 트리이다. 루트는 전체 활성 도메인을 나타내고, 각 노드는 필터로 특징지어지는 도메인의 부분집합에 대응하며, 각 조인 결과는 하나의 리프에 대응한다. 형식적으로 RRATree는 다음과 같이 정의된다. Definition 1 (RRATree). Let 𝑄 be an arbitrary join query. The RRATree of 𝑄 , denoted by 𝑇 ˜ 𝑄 , is a rooted tree that satisfies: (1) each node 𝑢 \in 𝑇 ˜ 𝑄 corresponds to a filter 𝜓 𝑢 ,(2) let 𝑟 be the root node of 𝑇 ˜ 𝑄 , then the filter 𝜓 𝑟 can be computed in $$ 𝑂 (| 𝑄 |)

time and satisfies 𝑄 = 𝑄 |𝜓 𝑟 ,(3) there is an upper-bound algorithm 𝑢𝑝𝑝 which takes a filter

𝜓 𝑢 with 𝑢 ∈ 𝑇 ˜ 𝑄 as input and returns a positive integer in

𝑂 (log |𝑄 |)

time, such that (a) ∀𝑢 ∈ 𝑇 ˜ 𝑄 , 𝑢𝑝𝑝 (𝜓 𝑢 ) ≥ | Res (𝑄 |𝜓 𝑢 )| ,(b) for any filter 𝜓 𝑢 with 𝑢 ∈ 𝑇 ˜ 𝑄 and 𝑢𝑝𝑝 (𝜓 𝑢 ) ≤ 1, Res (𝑄 |𝜓 𝑢 )

can be computed in $$ 𝑂 (log |𝑄 |)

time, (4) there is a children exploration algorithm 𝑐ℎ𝑖𝑙𝑑𝑟𝑒𝑛 , such that for each node 𝑢 \in 𝑇 ˜ 𝑄 , 𝑐ℎ𝑖𝑙𝑑𝑟𝑒𝑛 (𝜓 𝑢 ) returns at most a con-stant number of filters 𝜓 𝑣 1 , . . . ,𝜓 𝑣 𝑘 in $$ 𝑂 (log |𝑄 |)

time, such that (a) ∀𝑢 ∈ 𝑇 ˜ 𝑄 , 𝑐ℎ𝑖𝑙𝑑𝑟𝑒𝑛 (𝜓 𝑢 ) = ∅ iff 𝑢𝑝𝑝 (𝜓 𝑢 ) ≤ 1,(b) ⋃︁ 𝑘 𝑖 =1 Res (𝑄 |𝜓 𝑣 𝑖 ) = Res (𝑄 |𝜓 𝑢 ),(c) ∀1 ≤ 𝑖 < 𝑗 ≤ 𝑘, Res (𝑄 |𝜓 𝑣 𝑖 ) ∩ Res (𝑄 |𝜓 𝑣 𝑗 ) = ∅,(d) ∑︁ 𝑘 𝑖 =1 𝑢𝑝𝑝 (𝜓 𝑣 𝑖 ) ≤ 𝑢𝑝𝑝 (𝜓 𝑢 ),(e) ∀1 ≤ 𝑖 ≤ 𝑘, 𝑢𝑝𝑝 (𝜓 𝑣 𝑖 ) ≤ 12𝑢𝑝𝑝 (𝜓 𝑢 ).

893 1,4 , 1,4 , 1,4

𝑢𝑝𝑝 =8 1,2,1,4,1,4 𝑢𝑝𝑝 =2 3,3,4,4,1,3 𝑢𝑝𝑝 =1 3,3,4,4,4,4 𝑢𝑝𝑝 =1 4,4,1,4,1,4 𝑢𝑝𝑝 =2 2,2,1,3,1,4 𝑢𝑝𝑝 =1 4,4,1,3,1,4 𝑢𝑝𝑝 =1 (2,3,4) (3,4,1)(3,4,4) ∅ 12345678

⊥ ⊥ ⊥ ⊥ ⊥Figure 1: 𝑇 ˜ 𝑄 Δ when 𝑢𝑝𝑝 (𝜓 ) = ⌊AGM 𝑐 ∗ (𝑄 Δ |𝜓 )⌋

Figure 1은 𝑄 Δ의 RRATree를 보여주는데, 루트 노드는 𝑄 Δ의 전체 활성 도메인을 나타내고, 그 네 개의 자식은 각각 필터로 정의되는 도메인의 네 개의 서로소 부분집합을 나타낸다. RRATree를 바탕으로 우리는 함수족 𝜑 ∗를

𝑢𝑝𝑝 와 함께 정의하고 RRAccess 알고리즘을 개발한다. 직관적으로 Figure 1에서 루트 노드의 상한은 8이므로 구간 N[1, 8]에 대응된다. 그리고 그 네 자식은 각자의 상한에 해당하는 길이를 갖는 네 개의 서로소 부분구간에 대응되며, 그림에서는 색으로 구분되어 있다. 이 접근은 각 결과 튜플이 하나의 유일한 정수에 할당될 때까지 재귀되며, 그 정수는 다시 𝜑 ∗

𝑄 Δ

에서 해당 튜플로 매핑된다. 남은 정수들은 ⊥로 매핑된다. 형식적으로 조인 질의 𝑄 와 필터 집합 위의 부분순서 관계 ≺를 고정하자. 각 정수 𝑖 > 0에 대해, 만약 𝑡 ∈ Res (𝑄 )인 튜플이 존재하여

𝑖 =

ℎ−1

∑︂

𝑗 =1

∑︂ 𝜓 ∈𝑆 𝑗

𝑢𝑝𝑝 (𝜓 ) + 1, (1) where 𝑆 𝑗 = {𝜓 ∈ children (𝜓 𝑢 𝑗 ) | 𝜓 ≺ 𝜓 𝑢 𝑗 +1 }, 𝑢 1, . . . , 𝑢 ℎ is the path from the root 𝑟 to the leaf 𝑢 𝑡 (𝑢 1 = 𝑟 and 𝑢 ℎ = 𝑢 𝑡 ), and 𝑢 𝑡 ∈ 𝑇 ˜ 𝑄 is the leaf node such that 𝑡 ∈ Res (𝑄 |𝜓 𝑢𝑡 ), then 𝜑 ∗

𝑄

(𝑖 ) = 𝑡 . 그렇지 않고 그러한 튜플이 존재하지 않으면, 𝜑 ∗

𝑄

(𝑖 ) =⊥로 정의한다. 그러면 다음 보조정리가 성립한다.

Lemma 2. ∀𝑖 > 𝑢𝑝𝑝 (𝜓 𝑟 ), 𝜑 ∗

𝑄

(𝑖 ) =⊥.

우리의 relaxed random-access 알고리즘은 Algorithm 3으로 구현된다. 알고리즘은 𝜓 𝑟 에서 시작하는데, 이는 $$ 𝑂 (| 𝑄 | log |𝑄 |)

시간의 인덱스 구축 후 $$ 𝑂 (1)

시간에 계산할 수 있다. 그 다음 3-8행에서 알고리즘은 위에서 아래로 𝑇 ˜ 𝑄 를 순회하며 𝜑 ∗

𝑄

(𝑖 )를 포함할 수 있는 필터들의 경로를 찾는다. 각 필터 𝜓 와 그 자식들 𝑐ℎ𝑖𝑙𝑑𝑟𝑒𝑛 (𝜓 ) = 𝜓 1, . . . ,𝜓 𝑘 에 대해

𝑢𝑝𝑝 (𝜓 𝑖 ) ≤ 12𝑢𝑝𝑝 (𝜓 ) 가 모든 1 ≤ 𝑖 ≤ 𝑘 에 대해 성립하므로, 𝑇 ˜ 𝑄 의 깊이는 최대 $$ 𝑂 (log 𝑢𝑝𝑝 (𝜓 𝑟 ))

이고 노드 수는 𝑂 (𝑢𝑝𝑝 (𝜓 𝑟 )) 이다. 또한 𝑇 ˜ 𝑄 에서 순회된 모든 노드의 필터, 상한, 자식을 저장하는 캐싱 메커니즘을 사용하면(즉 중복 계산을 피하면), 𝑢𝑝𝑝 (𝜓 𝑟 ) \leq AGM (𝑄 )인 경우 다음 보조정리가 성립한다. Lemma 3. If 𝜓 𝑟 can be computed in $$ 𝑂 (1)

time, and there exist an algorithm 𝑢𝑝𝑝 and an algorithm 𝑐ℎ𝑖𝑙𝑑𝑟𝑒𝑛 satisfying the properties in Definition 1 and running in $$ 𝑂 (log |𝑄 |)

time, then if 𝑢𝑝𝑝 (𝜓 𝑟 ) \leq AGM (𝑄 ), Algorithm 3 is a relaxed random-access algorithm running in $$ 𝑂 (log 2 |𝑄 |)

worst-case time and $$ 𝑂 (log |𝑄 |)

amortized time. Algorithm 3: RRAccess 𝑄,𝜑 * Input: 𝑖 Output: 𝜑 * > 𝑄 (𝑖 ) if 𝜑 * > 𝑄 (𝑖 ) \neq⊥, otherwise a trivial interval containing 𝑖 > 1 offset \leftarrow 0; > 2 𝜓 \leftarrow 𝜓 𝑟 where 𝑟 is the root node of 𝑇 ˜ 𝑄 ; > 3 while 𝑢𝑝𝑝 (𝜓 ) \geq 2 do > 4 𝜓 1, . . . ,𝜓 𝑘 \leftarrow 𝑐ℎ𝑖𝑙𝑑𝑟𝑒𝑛 (𝜓 ); > 5 if offset +\sum︁ 𝑘 𝑗 =1 𝑢𝑝𝑝 (𝜓 𝑘 ) < 𝑖 then return [𝑖, 𝑖 ]; > 6 𝑟 * \leftarrow min {𝑟 \in N[1, 𝑘 ]| offset +\sum︁ 𝑟 𝑗 =1 𝑢𝑝𝑝 (𝜓 𝑗 ) \geq 𝑖 }; > 7 offset \leftarrow offset +\sum︁ 𝑟 * -1 > 𝑗 =1 𝑢𝑝𝑝 (𝜓 𝑗 ); > 8 𝜓 \leftarrow 𝜓 𝑟 * ; > 9 if Res (𝑄 |𝜓 ) \neq \emptyset then > 10 return the tuple in Res (𝑄 |𝜓 ) > 11 else return [𝑖, 𝑖 ]; 비고. 단순화를 위해, 이 절의 RRAccess 알고리즘은 나이브한 방법의 자명 구간 발견만 구현한다. 구체적으로 𝜑 𝑄 (𝑖 ) =⊥이면 알고리즘은 singleton 구간 [𝑖, 𝑖 ]만 반환한다. Section 5에서는 RRAccess 실행 중 더 큰 자명 구간을 효율적으로 발견하는 기법을 소개하여, 실제 열거 효율을 향상시킬 것이다. 이하에서는 트리 노드의 적절한 필터, $$ 𝑂 (log |𝑄 |)

시간 상한 알고리즘, 그리고 $$ 𝑂 (log |𝑄 |)

시간 자식 탐색 알고리즘을 소개한다. ## 4.2 트리 노드의 필터 본 논문에서 𝑇 ˜ 𝑄 의 노드들에 대응하는 모든 필터는 구간 필터(range filter)로 정의된다. 형식적으로 임의의 노드 𝑢 \in 𝑇 ˜ 𝑄 에 대해, 필터 𝜓 𝑢 는 구간들의 목록으로 표현될 수 있다: 𝜓 𝑢 = [[ 𝑙 𝑢, 1, ℎ 𝑢, 1], . . . , [𝑙 𝑢,𝑛 , ℎ 𝑢,𝑛 ]] .또한 𝜓 𝑢 가 empty range filter(또는 줄여서 empty range)라고 말하는 것은 오직 1 \leq 𝑖 \leq 𝑛 인 어떤 𝑖 에 대해 𝑙 𝑢,𝑖 > ℎ𝑢,𝑖 가 성립할 때뿐이다. 튜플 𝑡 \in 𝑅 이 𝜓 𝑢 를 만족하는 것은 각 𝑥 𝑖 \in att (𝑅 )에 대해 𝑥 𝑖 \in [ 𝑙 𝑢,𝑖 , ℎ 𝑢,𝑖 ] 가 성립하는 경우이다. Example 1에서 𝜓 = [[ 1, 2], [1, 4], [1, 4]] 라 두면, 𝑅 |𝜓 = {( 1, 2), (2, 3)} , 𝑆 |𝜓 = 𝑆 , 𝑇 |𝜓 = {( 4, 2)} 이고, 따라서 Res (𝑄 Δ |𝜓 ) = {( 2, 3, 4)} 이다. 또한 루트 노드 𝑟 의 필터는 𝜓 𝑟 =[︁ [min 𝑄 (𝑥 1), max 𝑄 (𝑥 1)] , . . . , [min 𝑄 (𝑥 𝑛 ), max 𝑄 (𝑥 𝑛 )] ]︁ 이며, 여기서 max 𝑄 (𝑥 𝑖 ) = max dom 𝑄 (𝑥 𝑖 ) 이고 min 𝑄 (𝑥 𝑖 ) = min dom 𝑄 (𝑥 𝑖 ) 이다. 1 \leq 𝑖 \leq 𝑛 에 대해 이러한 경계는 인덱스 구축 중 $$ 𝑂 (| 𝑄 |)

시간에 계산된다. 인덱스가 구축되면 𝜓 𝑟 는 $$ 𝑂 (1)

시간에 얻을 수 있고, ⋃︁ 𝑅 \in𝑄 𝑅 의 모든 튜플이 𝜓 𝑟 를 만족하므로 𝑄 |𝜓 𝑟 = 𝑄 이다. 또한 우리는 upper-bound 알고리즘과 children exploration 알고리즘이 효율적으로 계산될 수 있는 중요한 구간 필터 클래스인 “prefix range filters”를 정의한다. Definition 2. For any range filter 𝜓 = [[ 𝑙 1, ℎ 1], . . . , [𝑙 𝑛 , ℎ 𝑛 ]] , if there exists an integer 1 \leq 𝑠 \leq 𝑛 such that 𝜓 satisfies (1) \forall1 \leq 𝑖 < 𝑠 , 𝑙 𝑖 = ℎ𝑖 , (2) 𝑙 𝑠 \leq ℎ𝑠 , and (3) \forall𝑠 \leq 𝑖 \leq 𝑛 , 𝑙 𝑖 = min 𝑄 (𝑥 𝑖 ), ℎ 𝑖 = max 𝑄 (𝑥 𝑖 ), then 𝜓 is a prefix range filter with a split position 𝑠 .Moreover, if 𝑠 + 1 is not a split position of 𝜓 , then 𝑠 is the maximum split position of 𝜓 . 𝜓 𝑟 는 분할 위치 1을 갖는 prefix range filter임이 자명하다. 이후에 prefix range filter의 유리한 성질을 논의하고, RRATree의 모든 필터가 prefix range filter임을 증명할 것이다. 894 4.3 상한 알고리즘 𝐺 𝑄 를 𝑄 의 스키마 그래프라 하자. 분수 간선 덮개 𝑐 \in 𝐸𝐶 (𝐺 𝑄 )가 주어졌을 때, 이론 분석의 편의를 위해 우선 임의의 구간 필터 𝜓 에 대해 𝑢𝑝𝑝 (𝜓 ) = ⌊AGM 𝑐 (𝑄 |𝜓 )⌋ 로 정의한다. 모든 관계 크기는 정수이므로 AGM 경계의 바닥 함수 값도 여전히 조인 결과 크기의 상한 역할을 한다. 따라서 즉시 𝑢𝑝𝑝 (𝜓 ) \geq | Res (𝑄 |𝜓 )| 가 성립한다. Section 5에서는 조인 결과 크기에 대한 다른 상한도 소개한다. 더 타이트한 상한은 실제 알고리즘 효율, 즉 열거 지연과 총 실행 시간을 모두 줄여준다. Deng 등 [ 13 ]은 |att (𝑅 )| = 𝑑 인 각 관계 𝑅 에 대해 인덱스 구축 단계에서 $$ 𝑂 (| 𝑅 | log 𝑑 -1 |𝑅 |)

시간에 range tree를 구축하고, 임의의 구간 필터 𝜓 에 대해 |𝑅 |𝜓 |를

𝑂 (log 𝑑 −1 |𝑅 |)

시간에 계산할 수 있음을 보였다. 이제 우리는 임의의 prefix range filter 𝜓 에 대해, 필터링된 질의 𝑄 |𝜓 의 AGM 경계를 $$ 𝑂 (log |𝑄 |)

시간에 계산할 수 있음을 보인다. AGM 경계는 각 𝑅 \in 𝑄 에 대한 기수 |𝑅 |𝜓 | 를 얻고 나면 $$ 𝑂 (1)

시간에 계산할 수 있으므로, 이 기수들을 명시된 시간 안에 계산할 수 있음을 보이면 충분하다. 각 𝑅 ∈ 𝑄 에 대해 att (𝑅 ) = {𝑥 𝑟 1 , . . . , 𝑥 𝑟 𝑑 }라 하자. 여기서

𝑑 = |att (𝑅 )| 이고 𝑟 1, . . . , 𝑟 𝑑 ∈ N[1, 𝑛 ]이다. 𝑅 의 모든 튜플이 사전식으로 정렬되어 있다고 가정하자. 특히 ∀𝑡, 𝑡 ′ ∈ 𝑅에 대해, 𝑡 ≺ 𝑡 ′ iff (︁

𝑡 (𝑥 𝑟 1 ), . . . , 𝑡 (𝑥 𝑟 𝑑 ))︁ ≺(︁ 𝑡 ′ (𝑥 𝑟 1 ), . . . , 𝑡 ′ (𝑥 𝑟 𝑑 ))︁ 가 사전식 순서에서 성립한다고 하자. 그러면 함수 𝑅.𝑙𝑜𝑤𝑒𝑟 : Z𝑑 → N 과 𝑅.𝑢𝑝𝑝𝑒𝑟 :

Z𝑑 → N를 정의한다. 임의의 𝑑 -항 튜플 𝑡 에 대해(반드시 𝑅 의 원소일 필요는 없음), 𝑅.𝑙𝑜𝑤𝑒𝑟 (𝑡 )는 𝑡 ′ ≥ 𝑡 인 첫 번째 튜플 𝑡 ′ ∈ 𝑅 의 인덱스를 반환하고, 𝑅.𝑢𝑝𝑝𝑒𝑟 (𝑡 )는 𝑡 ′ > 𝑡 인 첫 번째 튜플

𝑡 ′ ∈ 𝑅 의 인덱스를 반환한다. 𝑅 [𝑡 𝑙 , 𝑡 ℎ ] = {𝑡 ∈ 𝑅 |𝑡 𝑙 ⪯ 𝑡 ⪯ 𝑡 ℎ } 와

𝑅.𝑐𝑛𝑡 (𝜓 ) = |𝑅 [𝑡 𝜓 𝑙 , 𝑡 𝜓 ℎ ]| = 𝑅.𝑢𝑝𝑝𝑒𝑟 (𝑡 𝜓 ℎ ) − 𝑅.𝑙𝑜𝑤𝑒𝑟 (𝑡 𝜓 𝑙 ) 로 정의하자. 여기서 𝜓 =

[[ 𝑙 1, ℎ 1], . . . , [𝑙 𝑛 , ℎ 𝑛 ]] , 𝑡 𝜓 𝑙 = (𝑙 𝑟 1 , . . . , 𝑙 𝑟 𝑑 ) 이고 𝑡 𝜓 ℎ = (ℎ𝑟 1 , . . . , ℎ 𝑟 𝑑 )이다. 그러면 다음 보조정리가 성립한다.

Lemma 4. For any prefix range filter 𝜓 , |𝑅 |𝜓 | = 𝑅.𝑐𝑛𝑡 (𝜓 ).

이제 각 𝑅 ∈ 𝑄 에 대해 $$ 𝑂 (log |𝑅 |)

시간 𝑅.𝑐𝑛𝑡 계산을 지원하는 인덱스를 제시한다. 𝑅.𝑐𝑛𝑡 를 계산하는 가장 단순한 방법은 𝑅 의 모든 튜플을 사전식으로 정렬한 배열을 유지하는 것이다. 이 배열이 있으면, 임의의 prefix range filter 𝜓 에 대해 𝑅.𝑙𝑜𝑤𝑒𝑟 (𝑡 𝜓 𝑙 ) 과 𝑅.𝑢𝑝𝑝𝑒𝑟 (𝑡 𝜓 ℎ ) 를 모두 이진 탐색을 통해 $$ 𝑂 (log |𝑅 |)

시간에 계산할 수 있고, 따라서 𝑅.𝑐𝑛𝑡 (𝜓 )도 $$ 𝑂 (log |𝑅 |)

시간에 계산된다. 하지만 이 방법은 갱신에는 비효율적이다. 각 삽입이나 삭제마다 $$ 𝑂 (| 𝑅 |)

개의 원소 이동이 필요할 수 있기 때문이다. 질의와 갱신을 모두 효율적으로 지원하기 위해, 우리는 자기 균형 이진 탐색 트리(BST), 예를 들어 AVL tree를 기본 인덱스 구조로 채택한다. 트리의 각 노드는 관계 테이블의 하나의 튜플과 일대일 대응하며, 각 노드의 튜플은 존재하는 경우 왼쪽(오른쪽) 자식의 튜플보다 사전식으로 크다(작다)는 이진 탐색 성질을 유지한다. 더 나아가 각 노드

𝑢 는 자신을 루트로 하는 부분트리의 크기인 𝑢.𝑠𝑖𝑧𝑒 를 저장하여, 관계 내 특정 범위에 있는 튜플 수를 효율적으로 셀 수 있게 한다. 트리 균형 유지와 부분트리 크기 유지 모두 삽입 또는 삭제당 $$ 𝑂 (log |𝑅 |)

시간에 수행할 수 있으므로, 이 인덱스 구조는 로그 오버헤드로 동적 갱신을 효율적으로 지원한다. BST 구조와 저장된 크기를 사용하면, 임의의 튜플 𝑡 \in Z𝑑 에 대해 𝑅.𝑙𝑜𝑤𝑒𝑟 (𝑡 ) 와 𝑅.𝑢𝑝𝑝𝑒𝑟 (𝑡 ) 를 루트에서 리프까지의 순회를 통해 $$ 𝑂 (log |𝑅 |)

시간에 계산할 수 있다. 즉, 임의의 prefix range filter 𝜓 에 대해 𝑅.𝑐𝑛𝑡 (𝜓 ) = 𝑅.𝑢𝑝𝑝𝑒𝑟 (𝑡 𝜓 ℎ ) − 𝑅.𝑙𝑜𝑤𝑒𝑟 (𝑡 𝜓 𝑙 )

를 $$ 𝑂 (log |𝑅 |)

시간에 계산할 수 있다. 그러면 Lemma 5. For any prefix range filter 𝜓 and any fractional edge cover 𝑐 ∈ 𝐸𝐶 (𝐺 𝑄 ), both AGM 𝑐 (𝑄 |𝜓 ) and AGM (𝑄 |𝜓 ) can be calcu-lated in $$ 𝑂 (log |𝑄 |)

time.

따라서 임의의 prefix range filter 𝜓 에 대해 𝑢𝑝𝑝 (𝜓 ) = ⌊AGM 𝑐 (𝑄 |𝜓 )⌋

를 $$ 𝑂 (log |𝑄 |)

시간에 계산할 수 있다. 이제 우리는 𝑢𝑝𝑝 (𝜓 ) \leq 1일 때 조인 결과 𝑅𝑒𝑠 (𝑄 |𝜓 )를 $$ 𝑂 (log |𝑄 |)

시간에 계산할 수 있음을 보이고자 한다. 이를 위해 먼저 𝑢𝑝𝑝 의 성질 하나를 정의하는데, 이를 super-additivity라 하고, 𝑢𝑝𝑝 가 이 성질을 만족하면 𝑢𝑝𝑝 (𝜓 ) ≤ 1인 임의의 𝜓 에 대해 𝑅𝑒𝑠 (𝑄 |𝜓 )를 $$ 𝑂 (log |𝑄 |)

시간에 계산할 수 있음을 증명한다. Property 1 (super-additivity). Given any range filter 𝜓 = [[ 𝑙 1, ℎ 1], . . . , [𝑙 𝑛 , ℎ 𝑛 ]] and 1 \leq 𝑝 \leq 𝑛 , for any partition of the inter-val [𝑙 𝑝 , ℎ 𝑝 ] into 𝑘 disjoint sub-intervals 𝐼 1, . . . , 𝐼 𝑘 such that [𝑙 𝑝 , ℎ 𝑝 ] =⋃︁ > 𝑘 𝑖 =1 𝐼 𝑖 and 𝐼 𝑖 \cap𝐼 𝑗 = \emptyset for 𝑖 \neq 𝑗 , the inequality \sum︁ 𝑘 𝑖 =1 𝑢𝑝𝑝 ([[ 𝑙 1, ℎ 1], . . . , 𝐼 𝑖 , . . . , [𝑙 𝑛 , ℎ 𝑛 ]]) \leq 𝑢𝑝𝑝 (𝜓 ) holds. 상한 알고리즘이 Property 1을 만족하면 이를 super-additive라고 부른다. 그러면 다음 보조정리가 성립한다. Lemma 6. If 𝑢𝑝𝑝 is super-additive, then for any prefix range filter 𝜓 = [[ 𝑙 1, ℎ 1], . . . , [𝑙 𝑛 , ℎ 𝑛 ]] such that 𝑢𝑝𝑝 (𝜓 ) \leq 1, Res (𝑄 |𝜓 ) can be computed in $$ 𝑂 (log |𝑄 |)

time.

또한 이 절에서 제안한 상한 알고리즘은 super-additive이다. 이는 AGM split theorem [ 13 ]으로부터 쉽게 도출될 수 있다. 따라서 𝑢𝑝𝑝 (𝜓 ) ≤ 1인 임의의 prefix range filter 𝜓 에 대해,

Res (𝑄 |𝜓 )를 $$ 𝑂 (log |𝑄 |)

시간에 계산할 수 있다. ## 4.4 자식 탐색 알고리즘 RRAccess 의 경로 탐색 과정에서, 방문한 각 노드의 자식을 $$ 𝑂 (log |𝑄 |)

시간에 계산하기 위해, 우리는 효율적인 자식 탐색 알고리즘을 개발한다. 이 알고리즘은 prefix range filter 𝜓 를 입력으로 받아 Definition 1에서 요구하는 자식 필터들 𝜓 1, . . . ,𝜓 𝑘 를 출력한다. 우리의 접근은 Deng 등 [ 13 ]이 제안한 활성 도메인 분할 전략을 따른다. 우리는 새로운 분할 알고리즘과 더 효율적인 자료구조를 도입함으로써 그들의 방법을 개선하며, 이로써 계산 복잡도를 관계의 최대 차수인 𝑑 = max 𝑅 ∈𝑄 att (𝑅 )에 대해 $$ 𝑂 (log 𝑑 |𝑄 |)

에서 $$ 𝑂 (log |𝑄 |)

로 줄인다.

divide 연산. 구체적으로 “di-vide” 연산을 정의한다. 이 연산은 𝑠 =

min {𝑖 |𝑙 𝑖 ≠ ℎ𝑖 } 인 구간 필터 𝜓 = [[ 𝑙 1, ℎ 1], . . . , [𝑙 𝑛 , ℎ 𝑛 ]] 를 입력으로 받아, 세 개의 구간 필터 𝜓 left ,𝜓 mid ,𝜓 right 를 출력한다. 이들의 형태는 [[ 𝑙 1, ℎ 1], . . . , [𝑙 ′

𝑠

, 𝑟 ′

𝑠

], . . . , [𝑙 𝑛 , ℎ 𝑛 ]] 이며, 여기서 [𝑙 ′

𝑠

, 𝑟 ′

𝑠

]

는 각각 [𝑙 𝑠 , 𝑝 − 1], [𝑝, 𝑝 ] 및 [𝑝 + 1, ℎ 𝑠 ] 이다. 그리고 (1) 𝑢𝑝𝑝 (𝜓 left ) + 𝑢𝑝𝑝 (𝜓 mid ) + 𝑢𝑝𝑝 (𝜓 right ) ≤ 𝑢𝑝𝑝 (𝜓 ),(2) 𝑢𝑝𝑝 (𝜓 left ) ≤ 12𝑢𝑝𝑝 (𝜓 ), 𝑢𝑝𝑝 (𝜓 right ) ≤ 12𝑢𝑝𝑝 (𝜓 ) 를 만족한다. 상한 알고리즘이 super-additive라고 가정하면, (1)은 임의의 𝑝 ∈ N[𝑙 𝑠 , ℎ 𝑠 ]에 대해 성립한다. Deng 등 [ 13 ]은 𝑢𝑝𝑝 (𝜓 left ) ≥ 12𝑢𝑝𝑝 (𝜓 ) 를 만족하는 [𝑙 𝑠 , ℎ 𝑠 ] 안의 최소 정수를 이진 탐색으로 찾음으로써 (2)를 만족하는 적절한 분할점 𝑝 를 계산한다. 이들의 이진 탐색 과정 각 반복에서는 range tree로 구현된 count oracle을 사용해 각 필터링된 관계의 기수를 계산한다. 이로 인해 divide 연산의 시간 복잡도는 𝑑 = max 𝑅 ∈𝑄 |att (𝑅 )| 에 대해 $$ 𝑂 (log 𝑑 |𝑄 |)

가 된다. 반면 우리는 prefix range filter를 나눌 때 분할점 𝑝 를 $$ 𝑂 (log |𝑄 |)

시간에 계산할 수 있음을 보인다. 이를 위해 먼저 𝑠 가 𝜓 의 유효한 분할 위치임을 보이고, 문제를 동등한 최적화 문제로 환원한 다음, 이를 푸는 효율적인 $$ 𝑂 (log |𝑄 |)

시간에 해결하는 Multi -Head Binary Search (MHBS) 알고리즘(Algorithm 4 참조)을 제안한다. 직관적으로 MHBS 알고리즘은 각 배열에 대해 하나의 이진 탐색 구간을 유지하고, 선택 기준에 따라 선택된 한 배열의 구간을 반복적으로 절반으로 줄인다. 이 과정은 모든 구간이 최적해로 수렴할 때까지 계속된다.

Lemma 8. Algorithm 4 returns the maximum integer 𝑝 ∗ such that

𝐹 (𝑝 ∗) ≤ 𝑇 in $$ 𝑂 (log ∑︁ 𝑘 𝑖 =1 |𝐴 𝑖 |)

time. \sum︁ 𝑘 𝑖 =1 |𝐴 𝑖 | \leq \sum︁ 𝑘 𝑖 =1 |𝑅 𝑖 | \leq | 𝑄 | 이므로, 즉시 Corollary 1. The divide operation on any prefix range filter can be performed in $$ 𝑂 (log |𝑄 |)

time.

x y

𝜓

children

x y

𝜓 1

𝜓 2

𝜓 3

𝜓 4

𝜓 5

𝜓 6 𝜓 7

Figure 2: 𝜓 의 𝑄 Δ에서의 분할.

비고. 각 관계 테이블의 모든 튜플이 사전식으로 정렬되어 있다는 가정은 분석의 편의를 위한 것이며, 일반성을 잃지 않는다. 균형 트리, B-tree, skip list, trie와 같은 다른 계층적 인덱싱 구조들도 Section 4.3에서 논의한 것과 유사한 방식으로 약간의 구현 수정만으로 지원할 수 있기 때문이다.

Algorithm 5: 𝑐ℎ𝑖𝑙𝑑𝑟𝑒𝑛

Input: 𝜓

Output: a list of filters

1

if 𝑢𝑝𝑝 (𝜓 ) ≤ 1 then return ∅;

2

𝑟𝑒𝑠 ← ∅ ;

3

divide 𝜓 into 𝜓 left ,𝜓 mid ,𝜓 right ;

4

if 𝑢𝑝𝑝 (𝜓 left ) > 0 and 𝜓 left is not empty then

5

𝑟𝑒𝑠 ← 𝑟𝑒𝑠 ∪ { 𝜓 left }

6

if 𝑢𝑝𝑝 (𝜓 mid ) = 1 then 𝑟𝑒𝑠 ← 𝑟𝑒𝑠 ∪ { 𝜓 mid };

7

else 𝑟𝑒𝑠 ← 𝑟𝑒𝑠 ∪ 𝑐ℎ𝑖𝑙𝑑𝑟𝑒𝑛 (𝜓 mid );

8

if 𝑢𝑝𝑝 (𝜓 right ) > 0 and 𝜓 right is not empty then

9

𝑟𝑒𝑠 ← 𝑟𝑒𝑠 ∪ { 𝜓 right }

10

return res; 그러면 임의의 prefix range filter 𝜓 에 대해, 𝑐ℎ𝑖𝑙𝑑𝑟𝑒𝑛 (𝜓 )는 Algorithm 5와 같이 재귀 방식으로 $$ 𝑂 (log |𝑄 |)

시간에 계산할 수 있다. 재귀 깊이는 최대 𝑑 이므로, Algorithm 5는 최대 2𝑑 + 1 \leq $$ 𝑂 (1)

개의 필터를 반환한다. Example 1에서 하나의 prefix range filter 𝜓 는 Figure 2에 보인 것처럼 최대 7개의 필터로 분할될 수 있다. 임의의 필터 𝜓 에 대해 𝑢𝑝𝑝 (𝜓 ) =

⌊AGM 𝑐 ∗ (𝑄 |𝜓 )⌋ 이고 𝑐 ∗ (𝑅 ) = 𝑐 ∗ (𝑆 ) = 𝑐 ∗ (𝑇 ) = 12 라고 하자.

𝑇 ˜ 𝑄 Δ 는 최종적으로 Figure 1과 같이 구성된다. 또한 분할 연산의 정의와 Property 1에 의해, 반환된 필터들이 Definition 1의 성질을 만족함은 쉽게 증명할 수 있다. 마지막으로 𝑇 ˜ 𝑄 의 모든 필터가 prefix range filter임을 확립한다.

Lemma 9. For any prefix range filter 𝜓 , let 𝜓 left , 𝜓 mid and 𝜓 right

d denote the three filters obtained by dividing 𝜓 , then all non - empty ranges among these filters are prefix range filters.

루트 노드의 필터(즉 𝜓 𝑟 )가 prefix range filter이므로, 귀납적으로 다음이 따른다.

Corollary 2. For any node 𝑢 ∈ 𝑇 ˜ 𝑄 , 𝜓 𝑢 is a prefix range filter.

4.5 거의 최적의 REnum 알고리즘

위 구현들은 REnum 성능에 대한 이론적 보장을 제공한다. 다음 정리는 𝑁 = 𝑢𝑝𝑝 (𝜓 𝑟 )

이고 임의의 구간 필터 𝜓 에 대해 𝑢𝑝𝑝 (𝜓 ) =⌊︁ AGM 𝑐 ∗ (𝑄 |𝜓 )⌋︁ 로 두었을 때 Algorithm 2를 분석함으로써 증명할 수 있다.

896 Theorem 3. There exists a constructive random-order enumeration algorithm for join queries with expected $$ 𝑂 ( AGM (𝑄 )|Res (𝑄 ) |+ 1 log 2 |𝑄 |)

delay and $$ 𝑂 (AGM (𝑄 ) log |𝑄 |)

total running time, after an $$ 𝑂 (| 𝑄 | log |𝑄 |)

-time index construction phase. Theorem 2와 [ 13 ]의 결과는 조합적 𝑘 -clique 가설 하에서, $$ 𝑂 (| 𝑄 | log |𝑄 |)

시간 인덱스 구축 단계 후 Algorithm 2의 기댓값 지연과 총 실행 시간이 모두 거의 최악의 경우 최적임을 보여준다.

비고. 우리의 알고리즘은 정적 관계에만 적용되는 것이 아니라, 데이터가 자주 삽입, 삭제, 갱신되는 진화하는 환경도 효율적으로 지원한다. Section 4.3과 4.4에서 논의했듯, 우리 프레임워크의 인덱스 구성 요소는 균형 트리, B-tree, skip list, trie와 같은 동적 자료구조를 이용해 구현할 수 있다. 이러한 동적 인덱스를 사용하면 제안한 알고리즘은 로그 시간 갱신을 지원하므로, 혼합 워크로드를 갖는 현대 데이터 시스템에 매우 적합하다.

4.6 공간 사용량

우리 알고리즘의 공간 복잡도는 두 구성요소가 지배한다: (1) ban-pick tree, (2) 캐시된 RRATree 구조. ban-pick tree와 RRATree 모두 최대

𝑂 (AGM (𝑄 )) 개의 노드를 포함하고, 각 노드는 평균적으로 $$ 𝑂 (1)

공간을 차지하므로, 전체 공간 복잡도는 $$ 𝑂 (AGM (𝑄 ))

이다. 실제 환경에서는 캐싱 메커니즘의 성능 이점을 대체로 유지하면서 공간 오버헤드를 줄이기 위한 세 가지 기법을 제안한다. 이 모든 기법은 Section 6에서 구현 및 평가된다.

금지 구간 병합. 새로운 구간 𝐼 를 금지할 때,

𝐵.𝑏𝑎𝑛 은 ban-pick tree를 루트에서 리프까지 순회하며 그 위치를 찾는다. 이 과정에서 𝐼 가 기존 노드의 구간과 병합될 수 있으면, 그 노드를 병합된 구간으로 갱신하여 𝐼 를 위한 새 노드를 만들 필요를 없앤다. 이 전략은 트리의 정확성을 유지하면서 공간 사용량을 줄인다.

필터의 온디맨드 해제. RRATree 노드가 자식 탐색 알고리즘에 의해 처리되고 나면, 그에 연관된 필터는 이후 과정에서 더 이상 필요하지 않다. 따라서 이러한 필터가 차지하는 메모리를 해제하여 전체 공간 오버헤드를 줄일 수 있다.

깊이 제한 캐싱. 열거 과정에서 RRATree의 깊이가 작은 노드일수록 훨씬 자주 접근되며, 노드 수는 깊이에 따라 급격히 증가한다. 따라서 메모리 예산이 제한될 때는 특정 깊이 임계값 이내의 노드만 캐싱하여, 자주 접근되는 노드를 저장하는 데 메모리를 가장 효과적으로 활용하고, 중복 재계산을 가능한 한 많이 줄인다.

5 열거 가속

명백하게도 큰 AGM (𝑄 )와 AGM (𝑄 )|𝑅𝑒𝑠 (𝑄 ) |+ 1 은 REnum 의 열거 지연과 총 실행 시간을 길게 만든다. 이 병목을 해결하기 위해, 우리의 열거 프레임워크를 바탕으로 실제에서 효율을 크게 향상시키는 두 가지 가속 기법을 제안한다.

5.1 더 큰 자명 구간 발견

우리는 자명 구간이 종종 연속적인 시퀀스로 나타나므로 더 큰 구간으로 묶을 수 있음을 관찰했다. 특히 AGM (𝑄 ) ≫ | 𝑅𝑒𝑠 (𝑄 )| 인 경우 그렇다. 열거 중 이러한 자명 정수들이 자주 선택되는 것을 피하기 위해 Larger Triv-ial Interval discovery (LTI) 기법을 제안한다. 이전 RRAccess 구현이 𝜑 𝑄 (𝑖 ) =⊥일 때 단일 점 구간 [𝑖, 𝑖 ]만 반환했던 것과 달리, LTI는 더 큰 자명 구간을 발견하여 더 많은 자명 정수가 후속 단계에서 선택되지 않도록 함으로써 열거를 가속한다.

필터의 자명 구간. 𝜑 ∗

𝑄

(𝑖 ) =⊥일 때, Algorithm 3은 오직 5행이나 11행에서만 자명 구간을 반환할 수 있음을 관찰하라. 𝑇 ˜ 𝑄 의 정의에 의해, 각 필터 𝜓 가 𝑐ℎ𝑖𝑙𝑑𝑟𝑒𝑛 (𝜓 ) =

𝜓 1, . . . ,𝜓 𝑘 를 만족하면 𝑢𝑝𝑝 (𝜓 ) ≥ ∑︁ 𝑘 𝑖 =1 𝑢𝑝𝑝 (𝜓 𝑖 ) 이다. 따라서 어떤 정수 𝑖 가

(오프셋 제거 후) (∑︁ 𝑘 𝑖 =1 𝑢𝑝𝑝 (𝜓 𝑖 ), 𝑢𝑝𝑝 (𝜓 )] 안에 들어가면, 𝜑 ∗

𝑄

(𝑖 ) =⊥가 된다. 즉, 이러한 구간은 발견되어 후속 단계에서 금지되어야 한다. 그러면 5행의 경우, 임의의 정수 offset +∑︁ 𝑘 𝑗 =1 𝑢𝑝𝑝 (𝜓 𝑘 ) < 𝑡 ≤ offset + 𝑢𝑝𝑝 (𝜓 ) 에 대해

𝜑 ∗

𝑄

(𝑡 ) =⊥ 이므로, 필터 𝜓 의 자명 구간을

𝐼 𝜓 =

⎡⎢⎢⎢⎢⎣

offset +

𝑘

∑︂

𝑗 =1

𝑢𝑝𝑝 (𝜓 𝑘 ) + 1, offset + 𝑢𝑝𝑝 (𝜓 )

⎤⎥⎥⎥⎥⎦

, (2) 로 정의하고, RRAccess 𝑄,𝜑 ∗ 가 [𝑖, 𝑖 ] 대신 𝐼 𝜓 를 반환하게 한다. 11행의 경우 알고리즘은 이미 𝑇 ˜ 𝑄 의 리프 노드에 도달한 상태이며(즉 𝑢𝑝𝑝 (𝜓 ) = 1), 그 리프 노드는 어떤 결과 튜플에도 대응하지 않는다. 따라서 𝜓 의 자명 구간을 𝐼 𝜓 = [𝑖, 𝑖 ] 로 정의하고 RRAccess 𝑄,𝜑 ∗ 가 이를 반환하게 한다. Example 1에서 열거 과정 중 RRAccess 𝑄 Δ,𝜑 ∗ (7)을 호출하면, 알고리즘은 먼저 𝐶 𝑟 ← 𝑐ℎ𝑖𝑙𝑑𝑟𝑒𝑛 (𝜓 𝑟 )를 계산한다. Figure 1에 보인 것처럼 ∑︁ 𝜓 ∈𝐶 𝑟 𝑢𝑝𝑝 (𝜓 ) = 6 < 7 이므로,

𝐼 𝜓 𝑟 =[︁∑︁ 𝜓 ∈𝐶 𝑟 𝑢𝑝𝑝 (𝜓 ) + 1, 𝑢𝑝𝑝 (𝜓 𝑟 )]︁ = [7, 8] 을 반환한다. 그러면 Ban-Pick tree는 [7, 8]을 금지하고 후속 단계에서 그 안의 정수를 더 이상 선택하지 않으므로, RRAccess 𝑄 Δ,𝜑 ∗ (8)을 호출할 필요가 없어진다. 각 자명 구간 [𝑙, ℎ ]은 열거 과정 중 RRAc-cess 𝑄,𝜑 ∗ 에 의해 최대 한 번만 생성된다는 점에 주목하라. 그렇지 않다면 [𝑙, ℎ ]이 금지된 뒤에도 그 안의 어떤 정수 𝑖 ∈ [ 𝑙, ℎ ]가 선택되어야 하는데, 이는 모순이다. 또한 𝑇 ˜ 𝑄 와 𝜑 ∗의 정의에 의해, 𝑇 ˜ 𝑄 의 필터들에 대한 자명 구간들은 서로 서로소이다. 이 기본 LTI 기법은 Section 6에서 평가한다.

연속 자명 구간 병합. 우리는 많은 자명 구간이 서로 이어져 있으며 더 큰 구간으로 병합될 수 있음을 관찰했다. 구체적으로 𝑇 ˜ 𝑄 와 𝜑 ∗의 정의에 의해, 𝑇 ˜ 𝑄 안의 임의의 필터 𝜓

에 대해, 𝜓 ′ ∈ 𝑐ℎ𝑖𝑙𝑑𝑟𝑒𝑛 (𝜓 ) 를 𝜓 의 마지막 자식이라 하자. 그러면 구간

𝐼 𝜓 와 𝐼 𝜓 ′ 는 서로 연속된다. 예를 들어 𝑇 ˜ 𝑄 Δ (Figure 1)에서 루트 필터 𝜓 𝑟 의 마지막 자식은 𝜓 ′

𝑟

= [[ 4, 4], [1, 4], [1, 4]] 이고, 따라서 자명 구간 𝐼 𝜓 ′

𝑟

= [6, 6] 은 𝐼 𝜓 𝑟 = [7, 8] 과 연속된다. 더 나아가 RRAccess 의 재귀 과정에서 필터 𝜓 의 자명 구간 𝐼 𝜓 를 얻고 나면, 𝐼 𝜓 와 병합 가능한 연속 자명 구간들을 계산하기 위해 현재 필터의 마지막 자식을 재귀적으로 방문하고, 재귀 복귀 시 부모의 자명 구간과 병합 가능한지를 판별할 수 있다(예를 들어 𝜓 가 부모 𝜓 ∗의 마지막 자식이라면, 자명 구간 𝐼 𝜓 ∗ 는 𝐼 𝜓 와 병합될 수 있다). 그러면 RRAccess 를 너무 많이 호출하지 않고도 $$ 𝑂 (log |𝑄 |)

시간에 병합된 자명 구간을 얻을 수 있다. 그 결과 열거 과정 중 RRAccess 호출 횟수가 줄어 실제 성능이 향상된다. 또한 열거 과정 중 병합된 두 개의 897 자명 구간이 서로 겹치지 않음을 증명할 수 있다. 우리는 기본 LTI의 이 변형(merging trivial intervals, MTI)을 Section 6에서 평가한다. 배치 자명 구간 발견. RRAccess 호출 수를 더 줄이기 위해, 우리는 MTI 기법을 강화하여 한 번의 RRAccess 실행 안에서 여러 개의 자명 구간을 발견하고 보고하도록 한다. 구체적으로 RRATree의 위에서 아래로의 순회 경로를 따라, 방문한 각 노드의 자명 구간을 계산하고 그 마지막 자식의 사슬을 재귀적으로 탐색한다. 이 경로를 따라 발견된 모든 자명 구간은 가능할 때 병합되어 Ban-Pick Tree에 보고된다. 이 방식으로, 열거 지연은 $$ 𝑂 ( AGM (Q)|𝑅𝑒𝑠 (𝑄 ) | log 3 |𝑄 |)

로 증가하지만, 총 실행 시간은 여전히

𝑂 (AGM (𝑄 ) log |𝑄 |)

이며, 열거 과정 중 RRAccess 호출 횟수는 줄어든다. 우리는 MTI의 이 변형(batch trivial interval discovery, BTI)을 Section 6에서 평가한다.

5.2 더 타이트한 상한 추정

이 절에서는 Tighter Upper-bound estimation (TU) 기법을 소개하며, 이는 LTI의 효과를 강화한다. 먼저 동기 부여 예시를 통해 그 영향을 설명한다. 임의의 𝜓 에 대해 𝑢𝑝𝑝 (𝜓 ) = ⌊AGM (𝑄 |𝜓 )⌋ 를 ⌊AGM 𝑐 ∗ (𝑄 |𝜓 )⌋ 대신 사용한다고 하자. 그러면 𝑇 ˜ 𝑄 Δ 는 Figure 3과 같다. 𝜓 = [[ 4, 4], [1, 4], [1, 4]] 에 대해,

|𝑅 |𝜓 | = |𝑇 |𝜓 | = 1 이고 |𝑆 |𝜓 | = 4 이다. 그러면 𝑢𝑝𝑝 (𝜓 ) = ⌊AGM (𝑄 Δ |𝜓 )⌋ =

1 < ⌊AGM 𝑐 ∗ (𝑄 Δ |𝜓 )⌋ = 2 이다. 이 더 타이트한 상한은 𝜓 𝑟 의 자명 구간 크기를 증가시켜, 𝐼 𝜓 𝑟 = [6, 8] 을 얻게 하며, 이는 [7, 8] 대신이다. 즉 TU는 RRATree의 더 낮은 레벨에 있는 필터들의 자명 구간을 확장하여, 더 많은 자명 정수가 더 이른 시점에 발견되고 금지되도록 하고, 그 결과 LTI의 효과를 강화한다. 이 절에서는 두 가지 서로 다른 상한 알고리즘을 소개한다. 둘 다 Definition 1의 성질을 만족하고 super-additive임을 확인할 수 있다. 실제 구현에서는 각 prefix range filter 𝜓 에 대해, 이 상한 알고리즘들 가운데 최소값을 |𝑅𝑒𝑠 (𝑄 |𝜓 )| 의 추정 상한으로 사용하며, 이를

𝑢𝑝𝑝 ∗ (𝜓 )라고 한다. 이 방식이면 𝑢𝑝𝑝 ∗ 가 Definition 1에서 정의한 성질을 만족함은 분명하다. 또한 다음 보조정리에서 형식화하듯이 super-additive이다.

Lemma 10. If the upper-bound algorithms 𝑢𝑝𝑝 1, . . . , 𝑢𝑝𝑝 𝑐 are super-additive, then the upper-bound algorithm 𝑢𝑝𝑝 ∗, where ∀𝜓 ,

𝑢𝑝𝑝 ∗ (𝜓 ) = min 𝑐 𝑖 =1 𝑢𝑝𝑝 𝑖 (𝜓 ), is also super-additive.

따라서 𝑢𝑝𝑝 ∗ 를 Section 4에서 제시한 상한 알고리즘의 대체물로 사용할 수 있다.

최소화된 AGM 경계 기반 상한. 임의의 조인 질의 𝑄 ∈ Q 에 대해, |𝑅𝑒𝑠 (𝑄 )| ≤ ⌊ AGM (𝑄 )⌋ 이다. 열거 과정에서, 최소 AGM 경계 AGM (𝑄 |𝜓 )는 관계들의 크기 {| 𝑅 |𝜓 || 𝑅 ∈ 𝑄 }를 $$ 𝑂 (log |𝑄 |)

시간에 계산한 뒤 선형계획법을 풀어 $$ 𝑂 (1)

시간에 계산할 수 있다. 그러나 이 선형계획법을 푸는 데는 상당한 계산 오버헤드가 든다. 절충안으로, 우리는 소수의 대표적인 분수 간선 덮개를 휴리스틱하게 선택하고, 그에 해당하는 AGM 경계들의 최소값을 계산한다. 이 접근은 선형계획법을 반복적으로 푸는 비용을 피하면서도 효과적으로 더 타이트한 상한을 제공한다. Example 1에서 𝑇 ˜ 𝑄 Δ 의 위에서 아래로 순회 동안, 각 속성의 활성 도메인은 순서대로 𝑥 ,

𝑦 , 𝑧 순으로 점차 축소된다. 𝑥 가 가장 먼저 제약되는 속성이므로, 𝑥 를 포함하는 필터링된 관계들의 기수(즉 𝑅 과 𝑇 )는 𝑇 ˜ 𝑄 Δ 의 각 루트-리프 경로에서 더 빠르게 감소할 것이다. 따라서 𝑅 과 𝑇 에 더 큰 분수 간선 덮개 가중치를 부여하면 더 작은 AGM 경계를 얻게 된다. 예를 들어 prefix range filter

𝜓 = [[ 4, 4], [1, 4], [1, 4]] 를 보자. 𝑐 ∈ 𝐸𝐶 (𝑄 Δ) 이고 𝑐 (𝑅 ) = 𝑐 (𝑇 ) = 1 및

𝑐 (𝑆 ) = 0 이라고 하면, AGM 𝑐 (𝑄 Δ |𝜓 ) = 1 < AGM 𝑐 ∗ (𝑄 Δ |𝜓 ) = 2 이다. 이 예시는 도메인 축소 순서에서 더 일찍 나타나는 속성을 포함하는 관계에 더 큰 분수 간선 덮개 가중치를 할당하면 RRATree의 낮은 레벨에서 더 타이트한 AGM 경계를 얻을 수 있음을 보여준다. 실제로는 이 원칙에 기반해 상수 개수의 분수 간선 덮개를 휴리스틱하게 선택하고, 모든 관계 𝑅 ∈ 𝑄 에 대해 선택된 덮개들 중 적어도 하나의 𝑐 ∈ 𝐸𝐶 (𝑄 )가 𝑐 (𝑅 ) > 0 을 만족하도록 보장한다.

비순환 골격 질의 기반 상한. AGM 경계는 최악의 경우에 타이트하지만, 실제로는 매우 클 수 있으며 실제 결과 크기보다 훨씬 큰 경우가 많다. 이를 해결하기 위해, 우리는 추가적인 테이블 정보를 사용하여 실제에서 더 타이트할 수 있는 또 다른 상한을 제안한다. [ 27 ]에 따르면, 임의의 순환 조인 질의는 관계들의 부분집합을 제거하여 비순환 질의로 변환할 수 있다. 구체적으로 임의의 순환 조인 질의 𝑄 는 두 개의 부분질의 𝑄 𝑠

와 𝑄 𝑟 로 분해될 수 있으며, 𝑄 = 𝑄 𝑠 ⋈︁ 𝑄 𝑟 이다. 여기서 𝑄 𝑠 는 비순환 질의(골격 질의)이고, 𝑄 𝑟 는 남은 관계들로 이루어진 질의(잔여 질의)이다. Example 1에서 삼각형 질의 𝑄 Δ 는 비순환 골격 부분질의

𝑄 Δ𝑠 = 𝑅 (𝑥, 𝑦 )⋈︁ 𝑆 (𝑦, 𝑧 ) 와 잔여 부분질의 𝑄 Δ𝑟 = 𝑇 (𝑥, 𝑧 ) 로 분해될 수 있다. 위 분해를 바탕으로 다음 보조정리가 성립한다.

Lemma 11. For any join query 𝑄 and filter 𝜓 , if att (𝑄 𝑠 ) = att (𝑄 ),then |𝑅𝑒𝑠 (𝑄 |𝜓 )| ≤ | 𝑅𝑒𝑠 (𝑄 𝑠 |𝜓 )| . Otherwise, if att (𝑄 𝑠 ) ⊊ att (𝑄 ), for any fractional edge cover 𝑐 ∈ 𝐸𝐶 (𝐺 𝑄 𝑟 \𝑄 𝑠 ), |𝑅𝑒𝑠 (𝑄 |𝜓 )| ≤ | 𝑅𝑒𝑠 (𝑄 𝑠 |𝜓 )|·

AGM 𝑐 (𝑄 ∗

𝑟

|𝜓 ), where 𝑄 ∗

𝑟

= {𝑅 [att (𝑄 𝑟 ) \ att (𝑄 𝑠 )]| 𝑅 ∈ 𝑄 𝑟 }, and for any attribute set 𝑉 ⊆ att (𝑅 ), 𝑅 [𝑉 ] = {𝑡 [𝑉 ]| 𝑡 ∈ 𝑅 }.

열거 전에 𝑄 ∗

𝑟

에 대해 Section 4에서 설명한 인덱스를 구축하므로, 임의의 𝜓 에 대해 AGM 𝑐 (𝑄 ∗

𝑟

|𝜓 )를 $$ 𝑂 (log |𝑄 |)

시간에 계산할 수 있다. |𝑅𝑒𝑠 (𝑄 𝑠 |𝜓 )| 에 대해서는 각 관계 𝑅 = {𝑡 1, . . . , 𝑡 |𝑅 | }가 사전식으로 정렬되어 있다고 가정하고, 각 𝑅 \in 𝑄 𝑠 에 대해 배열 𝐴 𝑅 및 그 prefix-sum 배열을 계산한다. 모든 1 \leq 𝑖 \leq | 𝑅 | 에 대해, 𝐴 𝑅 [𝑖 ] = |⋈︁ 𝑅 ' \in𝑇 𝑅 𝑅 ' ⋉ 𝑡 𝑖 | 이며, 여기서 𝑇 𝑅 는 𝑄 𝑠 의 조인 트리에서 𝑅 를 루트로 하는 부분트리를 뜻한다. 이러한 배열은 [ 27 ]에서 설명한 것과 유사한 동적 계획법으로 계산할 수 있으며, 시간은 $$ 𝑂 (| 𝑄 | log |𝑄 |)

이다. 그러면 각 테이블 𝑅 과 임의의 prefix range filter 𝜓 에 대해, prefix-sum 배열을 이용해 |( ⋈︁ 𝑅 ′ ∈𝑇 𝑅 𝑅 ′)⋈︁ 𝑅 |𝜓 | 를 $$ 𝑂 (log |𝑅 |)

시간에 효율적으로 계산할 수 있다. 이어서 |𝑅𝑒𝑠 (𝑄 𝑠 |𝜓 )| 는 𝑄 의 모든 𝑅 \in 𝑄 에 대한 이러한 기수를 사용해 $$ 𝑂 (1)

시간에 계산할 수 있다. 이 방법은

898 질의별 전처리로 $$ 𝑂 (| 𝑄 | log |𝑄 |)

조인 질의를 위한 효율적인 무작위 순서 열거를 향하여

Pengyu Chen

pchen.research@gmail.com Harbin Institute of Technology Harbin, China

Zizheng Guo

zguo.research@gmail.com Harbin Institute of Technology Zhengzhou Advanced Research Institute Zhengzhou, China

Jianwei Yang

yangjianwei006@cnpc.com.cn Harbin Institute of Technology Harbin, China

Dongjing Miao

miaodongjing@hit.edu.cn Harbin Institute of Technology Harbin, China

초록

기댓값 지연과, $$ 𝑂 (AGM (𝑄 ) log |𝑄 |)

총 실행 시간, 그리고 $$ 𝑂 (| 𝑄 | log |𝑄 |)

이며, 여기서

지연과

𝑂 (AGM (𝑄 ) log |𝑄 |)

총 실행 시간으로 열거하며, 그 전에 $$ 𝑂 (| 𝑄 | log |𝑄 |)

최악 시간과 $$ 𝑂 (log |𝑄 |)

지연과

𝑂 (AGM (𝑄 ) log |𝑄 |)

총 실행 시간으로 열거함을 보인다. 그리고 그 기댓값 열거 지연과 총 실행 시간이 이론적 하한보다 다항로그 인자만큼만 크므로 거의 최악의 경우 최적 알고리즘임이 증명된다. 또한 우리의 프레임워크는 실제 환경에서 열거 효율을 크게 향상시키는 실용적인 가속 기법도 가능하게 한다. 둘째, relaxed random-access tree (RRATree)라 부르는 논리적 트리 구조에 기반한 RRAccess 알고리즘을 설계한다. RRATree의 각 노드는 하나의 필터에 대응하고, 부모 노드의 필터를 만족하는 결과 튜플 집합은 그 자식들의 필터에 대응하는 부분집합으로 재귀적으로 분할된다. RRATree의 필터 성질을 최대한 활용하여 효율적인 자료구조를 구축하고, 상한 추정 알고리즘과 자식 탐색 알고리즘을 개발하는데, 이 둘은 모두 $$ 𝑂 (log |𝑄 |)

시간에 동작한다. 이러한 구성 요소 덕분에 RRAccess는 $$ 𝑂 (log 2 |𝑄 |)

최악 시간과 $$ 𝑂 (log |𝑄 |)

2 기초

본 논문에서 모든 정수의 집합은 Z로, 모든 자연수의 집합은 N으로 표기한다. 임의의 자연수 𝑖 와 𝑗 에 대하여

𝑖 ≤ 𝑗 이면, N[𝑖, 𝑗 ] = [𝑖, 𝑗 ] ∩ N으로 정의한다.

2.1 조인 질의

유한한 속성 집합 Att와 𝑈 ⊆ Att가 주어졌을 때, 𝑈 위의 튜플은 함수 𝑡 : 𝑈 → Z이고, 튜플 𝑡 의 𝑉 ⊆

𝑈 에 대한 사영, 즉 𝑡 [𝑉 ]는 각 𝑣 ∈

𝑉 에 대해 𝑡 [𝑉 ] ( 𝑣 ) = 𝑡 (𝑣 )를 만족하는 튜플이다. 관계 𝑅 은 동일한 속성 집합

(즉 입력의 크기). 질의 𝑄 의 결과는

Res (𝑄 ) := {𝑡 over att (𝑄 )|∀ 𝑅 ∈ 𝑄 : 𝑡 [att (𝑅 )] ∈ 𝑅 }, where att (𝑄 ) =⋃︁

𝑅 ∈𝑄

att (𝑅 ) 로 정의된다. 속성

𝑣 의 활성 도메인을 dom 𝑄 (𝑣 )로 두면,

즉, dom 𝑄 (𝑣 ) =⋃︁ 𝑅 ∈𝑄 ⋃︁ 𝑣 ∈att (𝑅 ) {𝑡 (𝑣 )| 𝑡 ∈ 𝑅 } 이고, 따라서

Res (𝑄 ) ⊆ ∏︁ 𝑣 ∈att (𝑄 ) dom 𝑄 (𝑣 ) 이다.

2.2 AGM 경계

(𝑉 , 𝐸 )로 정의되며, 여기서 𝑉 = att (𝑄 )이고 𝐸 = {att (𝑅 )| 𝑅 ∈ 𝑄 }이다. 𝑐 : 𝐸 → ( 0, 1)

를 𝐺 𝑄 의 분수 간선 덮개라고 하자. 즉, ∀𝑣 ∈ 𝑉 ,∑︁ 𝑣 ∈𝑒 𝑐 (𝑒 ) ≥ 1. 그러면

시간에 계산할 수 있다는 점에 유의하라. 𝑥 𝑦 𝑧 𝑆 𝑅 𝑇 > (a) 𝐺 𝑄 Δ 𝑥 𝑦 1 22 33 44 1 > (b) 𝑅 𝑦 𝑧 1 33 44 44 1 > (c) 𝑆 𝑥 𝑧 2 43 13 44 2 > (d) 𝑇 𝑥 𝑦 𝑧 2 3 43 4 13 4 4 > (e) 𝑅𝑒𝑠 (𝑄 Δ) Table 1: 𝑄 Δ := 𝑅 ⋈︁ 𝑆 ⋈︁ 𝑇 ## 2.3 균등 표본추출 조인 표본추출 알고리즘은 각 조인 결과 튜플을 동일한 확률로 출력한다. 형식적으로, 조인 표본추출 알고리즘은 입력으로 조인 질의 𝑄 를 받고 𝑅𝑒𝑠 (𝑄 ) 안의 튜플을 출력하는 무작위화 알고리즘 G이며, \forall𝑡 \in Res (𝑄 )에 대해 Pr (G( 𝑄 ) outputs 𝑡 ) = 1 > |Res (𝑄 ) | 를 만족한다. Deng 등 [ 13 ]에 따르면, (복잡도 가설 하에서) 거의 최악의 경우 최적인 조인 표본추출 알고리즘이 존재한다. Theorem 1 ([ 13 ]). There is a uniform join sampling algorithm running in expected $$ 𝑂 ˜ ( AGM (𝑄 ) > max {1,|𝑅𝑒𝑠 (𝑄 ) | } )

time after a $$ 𝑂 ˜ (| 𝑄 |)

-time index construction phase. Moreover, under the combinatorial 𝑘 -clique hypothesis, for any 𝜀 > 0, there is no uniform sampling algorithm for join queries that runs in $$ 𝑂 ˜ (| 𝑄 | + |𝑄 |𝜌 * -𝜀 > |Res (𝑄 ) | )

time with high probability, where 𝜌 ∗ is the fractional edge cover number of 𝐺 𝑄 .

2.4 무작위 순서 열거

3 열거 프레임워크 개요

Example 1 ( 𝑄 Δ). Let 𝑄 △ := 𝑅 ⋈︁ 𝑆 ⋈︁ 𝑇 , in which att (𝑅 ) =

{𝑥, 𝑦 }, att (𝑆 ) = {𝑦, 𝑧 } and att (𝑇 ) = {𝑥, 𝑧 }. The schema graph, rela-tion tables, and join results of 𝑄 Δ are shown in Table 1.

무작위 순서 열거를 위한 자연스러운 아이디어는 연속된 자연수 집합 N[1, |Res (𝑄 Δ)|]

3.1 Relaxed Random-Access 알고리즘

함수족 𝜑 ={︁ 𝜑 𝑄 |𝑄 ∈ Q }︁ 와 조인 질의 𝑄 가 주어졌다고 하자.

𝜑 𝑄 : N+ → Res (𝑄 ) ∪ {⊥} 는 각 튜플 𝑡 ∈ Res (𝑄 )

에 대해 오직 하나의 𝑖 ∈ N+, 𝜑 𝑄 (𝑖 ) = 𝑡 가 존재하는 성질을 만족한다. 또한 𝑁 을

𝑖 ≤ 𝑏 를 만족하는, 자명 정수만 포함하는 자명 구간 [𝑎, 𝑏 ] ⊆ N+ 를 반환한다. Section 4에서 우리는 $$ 𝑂 (log 2 |𝑄 |)

최악 시간과

𝑂 (log |𝑄 |)

상각 시간에 동작하는 relaxed random-access 알고리즘의 구현을 소개할 것이다. ## 3.2 Ban-Pick Tree 이미 선택되었거나 어떤 조인 결과에도 대응하지 않는 정수를 반복해서 선택하지 않기 위해, 그러한 정수를 나타내는 구간들의 모음을 동적으로 유지하고, 이를 이후 선택에서 제외한다. 구체적으로 우리는 두 종류의 정수를 정의한다: (1) 어떤 조인 결과에도 대응하지 않는 자명 정수, (2) 이전 단계에서 이미 선택된 선택 정수. 우리는 이러한 구간들이 서로소인 집합 𝐵 를 Ban-Pick tree라 부르는 자료구조를 사용해 유지한다. 이 구조와 두 연산은 새로 선택된 정수가 𝐵 의 어떤 구간에도 속하지 않음을 보장한다. 형식적으로 Ban-Pick tree는 다음 두 연산을 가능하게 한다: (1) 금지 연산 𝑩.𝒃𝒂𝒏 은 𝐵 의 모든 구간과 서로소인 구간을 입력받아 이를 𝐵 에 삽입한다. (2) 선택 연산 𝑩.𝒑𝒊𝒄𝒌 은 ∀𝐼 ∈ 𝐵, 𝐼 ⊆ [ 1, 𝐻 ]를 만족하는 정수 𝐻 를 입력받아 𝑖 ∈ [ 1, 𝐻 ] \ ∪ 𝐼 ∈𝐵 𝐼 를 균등 무작위로 반환한다. Ban-Pick tree를 기반으로 하면 𝐵 의 금지 구간 안에 있는 자명 정수와 선택 정수는 다시 선택되지 않게 된다. 일반적으로 N[1, 𝑁 ] \ ⋃︁ 𝐼 ∈𝐵 𝐼 는 연속 구간이 아니다. 이 때문에 하나의 구간에서 동작하는 단순 생성기는 실패한다. 따라서 우리는 서로소 구간들의 합집합 위에서 동작하는 pick 연산을 제공해야 한다. 𝐵 = {𝐼 𝑖 = [𝑙 𝑖 , ℎ 𝑖 ]| 𝑖 ∈ N[1, |𝐵 |]} 를 이미 금지된 서로소 구간들의 집합이라 하자. 일반성을 잃지 않고 ℎ𝑖 < 𝑙 𝑖 +1 가 모든 𝑖 ∈ N[1, |𝐵 | − 1]에 대해 성립한다고 하자. 𝐿 = |N[1, 𝑁 ] \ ∪ |𝐵 | > 𝑖 =1 𝐼 𝑖 |, 즉 𝐿 = 𝑁 −∑︁ |𝐵 | > 𝑖 =1 |𝐼 𝑖 | 라 하자. 우리의 pick 연산은 다음과 같이 동작한다: (1) 정수 𝑦 ∈ N[1, 𝐿 ]를 균등 무작위로 표본추출하고, (2) 오프셋 𝑏 =∑︁ 𝑘 ∗ > 𝑖 =1 |𝐼 𝑖 | 를 계산하되, ℎ𝑘 ∗ < 𝑦 + 𝑏 이고 𝑦 + 𝑏 < 𝑙 𝑘 ∗+1 (if 𝑘 ∗ < |𝐵 |)를 만족하게 하며, (3) 𝑦 + 𝑏 를 반환한다. Step (2)에서 오프셋을 효율적으로 계산하기 위해, Ban-Pick tree를 균형 트리 𝑇 𝐵 로 정의한다. 이 트리는 (1) 각 노드 𝑢 ∈ 𝑇 𝐵 가 하나의 구간 𝐼 𝑢 = [𝑢.𝑙, 𝑢.ℎ ] ∈ 𝐵 와 전단사로 대응하고, 𝑢.𝑙 과 𝑢.ℎ 를 통해 이를 저장한다. (2) 각 노드 𝑢 ∈ 𝑇 𝐵 는 왼쪽 자식과 오른쪽 자식을 가리키는 𝑢. left 와 𝑢. right 를 유지하며, 𝑣 가 𝑢 의 왼쪽(오른쪽) 자식이면 𝑣.ℎ < 𝑢.𝑙 (𝑣.𝑙 > 𝑢.ℎ ) 이다. (3) 각 노드 𝑢 ∈ 𝑇 𝐵 는 𝑢. take 를 유지하는데, 이는 𝑢 를 루트로 하는 부분트리에 있는 구간 길이들의 합을 나타낸다. (4) 𝑇 𝐵 의 높이는 $$ 𝑂 (log |𝐵 |)

이다.

Algorithm 1: 𝐵.𝑝𝑖𝑐𝑘

Input: 𝐻

Output: a uniform sample from N[1, 𝐻 ] \ ∪ 𝐼 ∈𝐵 𝐼

1

𝑢 ← the root of 𝑇 𝐵 ;

2

sample an integer 𝑦 ∈ N[1, 𝐻 − 𝑢.𝑡𝑎𝑘𝑒 ] uniformly;

3

𝑏 ← 0, temp ← 0;

4

while 𝑢 ≠ nil do

5

if 𝑢. left = nil then temp ← 0;

6

else temp ← 𝑢. left .take ;

7

if (𝑦 + 𝑏 ) + temp < 𝑢.𝑙 then 𝑢 ← 𝑢. left ;

8

else 𝑏 ← 𝑏 + temp + ( 𝑢.ℎ − 𝑢.𝑙 + 1), 𝑢 ← 𝑢. right ;

9

return 𝑦 + 𝑏

그러면 ban 연산은 각 구간 삽입에 대해 $$ 𝑂 (log |𝐵 |)

시간이 걸린다. 또한 우리는 Algorithm 1과 같이 𝐵.𝑝𝑖𝑐𝑘 의 효율적 구현을 설계한다. 알고리즘은 개념적으로 N[1, 𝐻 ]의 금지되지 않은 원소들을 하나의 “압축된 가용 공간” N[1, 𝐻 − 𝑟 .𝑡𝑎𝑘𝑒 ]로 이어붙인 것으로 본다. 여기서 𝑟 는 𝑇 𝐵 의 루트이다. 먼저 N[1, 𝐻 − 𝑟 .𝑡𝑎𝑘𝑒 ]에서 무작위 정수 𝑦 를 균등하게 표본추출한 다음, 892 𝑇 𝐵 를 순회하여 위치 𝑦 에 대응하는 금지되지 않은 구간을 찾고, 그 앞선 모든 금지 구간 길이의 총합과 같은 오프셋 𝑏 를 계산한다. 마지막으로 알고리즘은 𝑦 +𝑏 를 반환하는데, 이는 원래 공간 N[1, 𝐻 ]\∪ 𝐼 ∈𝐵 𝐼 에서의 매핑된 값이다. 예를 들어 𝐻 = 8이고 𝐵 = {[ 2, 3], [6, 6]} 라고 하자. 금지되지 않은 구간은 [1, 2], [4, 5], [7, 8]이고, 이들의 이어붙임은 압축된 가용 공간 N[1, 5]를 이룬다. 만약 N[1, 5]에서 𝑦 = 4가 표본추출되면, 이는 세 번째 금지되지 않은 구간 [7, 8]에 대응한다. 따라서 알고리즘은 𝑦 + 𝑏 = 4 + (|[ 2, 3]| + |[ 6, 6]|) = 7 을 반환한다. 𝑇 𝐵 의 높이는 최대 $$ 𝑂 (log |𝐵 |)

이므로, Algorithm 1은

𝑂 (log |𝐵 |)

비고. Ban-Pick tree는 기본 데이터 저장 및 접근 메커니즘과 독립적이므로, 코드 수정 없이 다양한 데이터베이스 시스템에 통합될 수 있다.

3.3 열거 프레임워크

Algorithm 2: REnum

Input: 𝑄

Output: Res (𝑄 ) in a random order

1

𝐵 ← ∅ , 𝑁 ban ← 0;

2

while 𝑁 ban < 𝑁 do

3

𝑖 ← 𝐵.𝑝𝑖𝑐𝑘 (𝑁 );

4

𝑟𝑒𝑠 ← RRAccess 𝑄,𝜑 ∗ (𝑖 );

5

if 𝑟𝑒𝑠 is a tuple in Res (𝑄 ) then

6

output 𝑟𝑒𝑠 ;

7

𝐵.𝑏𝑎𝑛 ([ 𝑖, 𝑖 ]) , 𝑁 ban ← 𝑁 ban + 1;

8

else 𝐵.𝑏𝑎𝑛 (𝑟𝑒𝑠 ), 𝑁 ban ← 𝑁 ban + | 𝑟𝑒𝑠 |;

Lemma 1. For any 𝑄 ∈ Q, if log 𝑁 ≤ $$ 𝑂 (log |𝑄 |)

and there exists a relaxed random-access algorithm 𝑅𝑅𝐴𝑐𝑐𝑒𝑠𝑠 𝑄,𝜑 running in

𝑂 (log 2 |𝑄 |)

worst-case time and $$ 𝑂 (log |𝑄 |)

amortized time, then Al-gorithm 2 enumerates the tuples in Res (𝑄 ) in random order with expected $$ 𝑂 ( 𝑁

|Res (𝑄 ) |+ 1

log 2 |𝑄 |)

delay and $$ 𝑂 (𝑁 log |𝑄 |)

total time.

지연과 $$ 𝑂 (AGM (𝑄 ) log |𝑄 |)

총 실행 시간으로 무작위 순서 열거한다. 여기서 𝜌 ∗는 𝐺 𝑄 의 분수 간선 덮개 수이다. 또한 [ 13 ]에 의해 $$ 𝑂 (AGM (𝑄 ) log |𝑄 |)

총 실행 시간은 조합적 𝑘 -clique 가설이 거짓이 아닌 한 최악의 경우 거의 최적이다. 더 나아가, 처음 열거된 결과 튜플은 𝑅𝑒𝑠 (𝑄 )에서의 균등 표본이므로, 조인 표본추출 알고리즘의 기댓값 실행 시간 하한은 무작위 순서 열거 알고리즘의 기댓값 지연 하한이기도 하다. 형식적으로 다음 정리가 성립한다. Theorem 2. Under the combinatorial 𝑘 -clique hypothesis, for any 𝜀 > 0, there is no random-order enumeration algorithm for join queries with expected $$ 𝑂 ˜ ( |𝑄 |𝜌 * -𝜀 > |Res (𝑄 ) |+ 1 )

delay after a $$ 𝑂 ˜ (| 𝑄 |)

-time preprocessing, where 𝜌 ∗ is the minimal fractional edge cover number of 𝐺 𝑄 . 이 정리는 $$ 𝑂 ˜ (| 𝑄 |)

시간 전처리 후, 기댓값 $$ 𝑂 ( AGM (𝑄 )|Res (𝑄 ) |+ 1 log 2 |𝑄 |) ≤ 𝑂 ( |𝑄 |𝜌 ∗

|Res (𝑄 ) |+ 1

log 2 |𝑄 |)

인 지연이 거의 최적임을 뜻한다. ## 4 RELAXED RANDOM-ACCESS 이 절에서는 $$ 𝑂 (log 2 |𝑄 |)

최악 시간과 $$ 𝑂 (log |𝑄 |)

상각 시간을 달성하는 RRAccess 의 효율적인 구현을 제시한다. 이어서 결과로 얻어지는 REnum 알고리즘을 분석하고, 공간 사용량을 줄이는 기법들을 소개한다. 이러한 보장을 달성하기 위해 RRAccess 는 relaxed random-access tree (RRATree) 라 부르는 개념적 트리 구조, 즉 𝑇 ˜ 𝑄 를 기반으로 구축된다. ## 4.1 RRATree와 RRAccess 개요 직관적으로 RRATree는 조인 질의의 활성 도메인을 재귀적으로 분할하는 개념적 트리이다. 루트는 전체 활성 도메인을 나타내고, 각 노드는 필터로 특징지어지는 도메인의 부분집합에 대응하며, 각 조인 결과는 하나의 리프에 대응한다. 형식적으로 RRATree는 다음과 같이 정의된다. Definition 1 (RRATree). Let 𝑄 be an arbitrary join query. The RRATree of 𝑄 , denoted by 𝑇 ˜ 𝑄 , is a rooted tree that satisfies: (1) each node 𝑢 \in 𝑇 ˜ 𝑄 corresponds to a filter 𝜓 𝑢 ,(2) let 𝑟 be the root node of 𝑇 ˜ 𝑄 , then the filter 𝜓 𝑟 can be computed in $$ 𝑂 (| 𝑄 |)

time and satisfies 𝑄 = 𝑄 |𝜓 𝑟 ,(3) there is an upper-bound algorithm 𝑢𝑝𝑝 which takes a filter

𝜓 𝑢 with 𝑢 ∈ 𝑇 ˜ 𝑄 as input and returns a positive integer in

𝑂 (log |𝑄 |)

can be computed in $$ 𝑂 (log |𝑄 |)

time, (4) there is a children exploration algorithm 𝑐ℎ𝑖𝑙𝑑𝑟𝑒𝑛 , such that for each node 𝑢 \in 𝑇 ˜ 𝑄 , 𝑐ℎ𝑖𝑙𝑑𝑟𝑒𝑛 (𝜓 𝑢 ) returns at most a con-stant number of filters 𝜓 𝑣 1 , . . . ,𝜓 𝑣 𝑘 in $$ 𝑂 (log |𝑄 |)

893 1,4 , 1,4 , 1,4

𝑢𝑝𝑝 =8 1,2,1,4,1,4 𝑢𝑝𝑝 =2 3,3,4,4,1,3 𝑢𝑝𝑝 =1 3,3,4,4,4,4 𝑢𝑝𝑝 =1 4,4,1,4,1,4 𝑢𝑝𝑝 =2 2,2,1,3,1,4 𝑢𝑝𝑝 =1 4,4,1,3,1,4 𝑢𝑝𝑝 =1 (2,3,4) (3,4,1)(3,4,4) ∅ 12345678

⊥ ⊥ ⊥ ⊥ ⊥Figure 1: 𝑇 ˜ 𝑄 Δ when 𝑢𝑝𝑝 (𝜓 ) = ⌊AGM 𝑐 ∗ (𝑄 Δ |𝜓 )⌋

𝑄 Δ

𝑖 =

ℎ−1

∑︂

𝑗 =1

∑︂ 𝜓 ∈𝑆 𝑗

𝑄

(𝑖 ) = 𝑡 . 그렇지 않고 그러한 튜플이 존재하지 않으면, 𝜑 ∗

𝑄

(𝑖 ) =⊥로 정의한다. 그러면 다음 보조정리가 성립한다.

Lemma 2. ∀𝑖 > 𝑢𝑝𝑝 (𝜓 𝑟 ), 𝜑 ∗

𝑄

(𝑖 ) =⊥.

우리의 relaxed random-access 알고리즘은 Algorithm 3으로 구현된다. 알고리즘은 𝜓 𝑟 에서 시작하는데, 이는 $$ 𝑂 (| 𝑄 | log |𝑄 |)

시간의 인덱스 구축 후 $$ 𝑂 (1)

시간에 계산할 수 있다. 그 다음 3-8행에서 알고리즘은 위에서 아래로 𝑇 ˜ 𝑄 를 순회하며 𝜑 ∗

𝑄

(𝑖 )를 포함할 수 있는 필터들의 경로를 찾는다. 각 필터 𝜓 와 그 자식들 𝑐ℎ𝑖𝑙𝑑𝑟𝑒𝑛 (𝜓 ) = 𝜓 1, . . . ,𝜓 𝑘 에 대해

𝑢𝑝𝑝 (𝜓 𝑖 ) ≤ 12𝑢𝑝𝑝 (𝜓 ) 가 모든 1 ≤ 𝑖 ≤ 𝑘 에 대해 성립하므로, 𝑇 ˜ 𝑄 의 깊이는 최대 $$ 𝑂 (log 𝑢𝑝𝑝 (𝜓 𝑟 ))

이고 노드 수는 𝑂 (𝑢𝑝𝑝 (𝜓 𝑟 )) 이다. 또한 𝑇 ˜ 𝑄 에서 순회된 모든 노드의 필터, 상한, 자식을 저장하는 캐싱 메커니즘을 사용하면(즉 중복 계산을 피하면), 𝑢𝑝𝑝 (𝜓 𝑟 ) \leq AGM (𝑄 )인 경우 다음 보조정리가 성립한다. Lemma 3. If 𝜓 𝑟 can be computed in $$ 𝑂 (1)

time, and there exist an algorithm 𝑢𝑝𝑝 and an algorithm 𝑐ℎ𝑖𝑙𝑑𝑟𝑒𝑛 satisfying the properties in Definition 1 and running in $$ 𝑂 (log |𝑄 |)

time, then if 𝑢𝑝𝑝 (𝜓 𝑟 ) \leq AGM (𝑄 ), Algorithm 3 is a relaxed random-access algorithm running in $$ 𝑂 (log 2 |𝑄 |)

worst-case time and $$ 𝑂 (log |𝑄 |)

amortized time. Algorithm 3: RRAccess 𝑄,𝜑 * Input: 𝑖 Output: 𝜑 * > 𝑄 (𝑖 ) if 𝜑 * > 𝑄 (𝑖 ) \neq⊥, otherwise a trivial interval containing 𝑖 > 1 offset \leftarrow 0; > 2 𝜓 \leftarrow 𝜓 𝑟 where 𝑟 is the root node of 𝑇 ˜ 𝑄 ; > 3 while 𝑢𝑝𝑝 (𝜓 ) \geq 2 do > 4 𝜓 1, . . . ,𝜓 𝑘 \leftarrow 𝑐ℎ𝑖𝑙𝑑𝑟𝑒𝑛 (𝜓 ); > 5 if offset +\sum︁ 𝑘 𝑗 =1 𝑢𝑝𝑝 (𝜓 𝑘 ) < 𝑖 then return [𝑖, 𝑖 ]; > 6 𝑟 * \leftarrow min {𝑟 \in N[1, 𝑘 ]| offset +\sum︁ 𝑟 𝑗 =1 𝑢𝑝𝑝 (𝜓 𝑗 ) \geq 𝑖 }; > 7 offset \leftarrow offset +\sum︁ 𝑟 * -1 > 𝑗 =1 𝑢𝑝𝑝 (𝜓 𝑗 ); > 8 𝜓 \leftarrow 𝜓 𝑟 * ; > 9 if Res (𝑄 |𝜓 ) \neq \emptyset then > 10 return the tuple in Res (𝑄 |𝜓 ) > 11 else return [𝑖, 𝑖 ]; 비고. 단순화를 위해, 이 절의 RRAccess 알고리즘은 나이브한 방법의 자명 구간 발견만 구현한다. 구체적으로 𝜑 𝑄 (𝑖 ) =⊥이면 알고리즘은 singleton 구간 [𝑖, 𝑖 ]만 반환한다. Section 5에서는 RRAccess 실행 중 더 큰 자명 구간을 효율적으로 발견하는 기법을 소개하여, 실제 열거 효율을 향상시킬 것이다. 이하에서는 트리 노드의 적절한 필터, $$ 𝑂 (log |𝑄 |)

시간 상한 알고리즘, 그리고 $$ 𝑂 (log |𝑄 |)

시간 자식 탐색 알고리즘을 소개한다. ## 4.2 트리 노드의 필터 본 논문에서 𝑇 ˜ 𝑄 의 노드들에 대응하는 모든 필터는 구간 필터(range filter)로 정의된다. 형식적으로 임의의 노드 𝑢 \in 𝑇 ˜ 𝑄 에 대해, 필터 𝜓 𝑢 는 구간들의 목록으로 표현될 수 있다: 𝜓 𝑢 = [[ 𝑙 𝑢, 1, ℎ 𝑢, 1], . . . , [𝑙 𝑢,𝑛 , ℎ 𝑢,𝑛 ]] .또한 𝜓 𝑢 가 empty range filter(또는 줄여서 empty range)라고 말하는 것은 오직 1 \leq 𝑖 \leq 𝑛 인 어떤 𝑖 에 대해 𝑙 𝑢,𝑖 > ℎ𝑢,𝑖 가 성립할 때뿐이다. 튜플 𝑡 \in 𝑅 이 𝜓 𝑢 를 만족하는 것은 각 𝑥 𝑖 \in att (𝑅 )에 대해 𝑥 𝑖 \in [ 𝑙 𝑢,𝑖 , ℎ 𝑢,𝑖 ] 가 성립하는 경우이다. Example 1에서 𝜓 = [[ 1, 2], [1, 4], [1, 4]] 라 두면, 𝑅 |𝜓 = {( 1, 2), (2, 3)} , 𝑆 |𝜓 = 𝑆 , 𝑇 |𝜓 = {( 4, 2)} 이고, 따라서 Res (𝑄 Δ |𝜓 ) = {( 2, 3, 4)} 이다. 또한 루트 노드 𝑟 의 필터는 𝜓 𝑟 =[︁ [min 𝑄 (𝑥 1), max 𝑄 (𝑥 1)] , . . . , [min 𝑄 (𝑥 𝑛 ), max 𝑄 (𝑥 𝑛 )] ]︁ 이며, 여기서 max 𝑄 (𝑥 𝑖 ) = max dom 𝑄 (𝑥 𝑖 ) 이고 min 𝑄 (𝑥 𝑖 ) = min dom 𝑄 (𝑥 𝑖 ) 이다. 1 \leq 𝑖 \leq 𝑛 에 대해 이러한 경계는 인덱스 구축 중 $$ 𝑂 (| 𝑄 |)

시간에 계산된다. 인덱스가 구축되면 𝜓 𝑟 는 $$ 𝑂 (1)

시간에 얻을 수 있고, ⋃︁ 𝑅 \in𝑄 𝑅 의 모든 튜플이 𝜓 𝑟 를 만족하므로 𝑄 |𝜓 𝑟 = 𝑄 이다. 또한 우리는 upper-bound 알고리즘과 children exploration 알고리즘이 효율적으로 계산될 수 있는 중요한 구간 필터 클래스인 “prefix range filters”를 정의한다. Definition 2. For any range filter 𝜓 = [[ 𝑙 1, ℎ 1], . . . , [𝑙 𝑛 , ℎ 𝑛 ]] , if there exists an integer 1 \leq 𝑠 \leq 𝑛 such that 𝜓 satisfies (1) \forall1 \leq 𝑖 < 𝑠 , 𝑙 𝑖 = ℎ𝑖 , (2) 𝑙 𝑠 \leq ℎ𝑠 , and (3) \forall𝑠 \leq 𝑖 \leq 𝑛 , 𝑙 𝑖 = min 𝑄 (𝑥 𝑖 ), ℎ 𝑖 = max 𝑄 (𝑥 𝑖 ), then 𝜓 is a prefix range filter with a split position 𝑠 .Moreover, if 𝑠 + 1 is not a split position of 𝜓 , then 𝑠 is the maximum split position of 𝜓 . 𝜓 𝑟 는 분할 위치 1을 갖는 prefix range filter임이 자명하다. 이후에 prefix range filter의 유리한 성질을 논의하고, RRATree의 모든 필터가 prefix range filter임을 증명할 것이다. 894 4.3 상한 알고리즘 𝐺 𝑄 를 𝑄 의 스키마 그래프라 하자. 분수 간선 덮개 𝑐 \in 𝐸𝐶 (𝐺 𝑄 )가 주어졌을 때, 이론 분석의 편의를 위해 우선 임의의 구간 필터 𝜓 에 대해 𝑢𝑝𝑝 (𝜓 ) = ⌊AGM 𝑐 (𝑄 |𝜓 )⌋ 로 정의한다. 모든 관계 크기는 정수이므로 AGM 경계의 바닥 함수 값도 여전히 조인 결과 크기의 상한 역할을 한다. 따라서 즉시 𝑢𝑝𝑝 (𝜓 ) \geq | Res (𝑄 |𝜓 )| 가 성립한다. Section 5에서는 조인 결과 크기에 대한 다른 상한도 소개한다. 더 타이트한 상한은 실제 알고리즘 효율, 즉 열거 지연과 총 실행 시간을 모두 줄여준다. Deng 등 [ 13 ]은 |att (𝑅 )| = 𝑑 인 각 관계 𝑅 에 대해 인덱스 구축 단계에서 $$ 𝑂 (| 𝑅 | log 𝑑 -1 |𝑅 |)

시간에 range tree를 구축하고, 임의의 구간 필터 𝜓 에 대해 |𝑅 |𝜓 |를

𝑂 (log 𝑑 −1 |𝑅 |)

시간에 계산할 수 있음을 보였다. 이제 우리는 임의의 prefix range filter 𝜓 에 대해, 필터링된 질의 𝑄 |𝜓 의 AGM 경계를 $$ 𝑂 (log |𝑄 |)

시간에 계산할 수 있음을 보인다. AGM 경계는 각 𝑅 \in 𝑄 에 대한 기수 |𝑅 |𝜓 | 를 얻고 나면 $$ 𝑂 (1)

𝑡 ′ ∈ 𝑅 의 인덱스를 반환한다. 𝑅 [𝑡 𝑙 , 𝑡 ℎ ] = {𝑡 ∈ 𝑅 |𝑡 𝑙 ⪯ 𝑡 ⪯ 𝑡 ℎ } 와

𝑅.𝑐𝑛𝑡 (𝜓 ) = |𝑅 [𝑡 𝜓 𝑙 , 𝑡 𝜓 ℎ ]| = 𝑅.𝑢𝑝𝑝𝑒𝑟 (𝑡 𝜓 ℎ ) − 𝑅.𝑙𝑜𝑤𝑒𝑟 (𝑡 𝜓 𝑙 ) 로 정의하자. 여기서 𝜓 =

Lemma 4. For any prefix range filter 𝜓 , |𝑅 |𝜓 | = 𝑅.𝑐𝑛𝑡 (𝜓 ).

이제 각 𝑅 ∈ 𝑄 에 대해 $$ 𝑂 (log |𝑅 |)

시간 𝑅.𝑐𝑛𝑡 계산을 지원하는 인덱스를 제시한다. 𝑅.𝑐𝑛𝑡 를 계산하는 가장 단순한 방법은 𝑅 의 모든 튜플을 사전식으로 정렬한 배열을 유지하는 것이다. 이 배열이 있으면, 임의의 prefix range filter 𝜓 에 대해 𝑅.𝑙𝑜𝑤𝑒𝑟 (𝑡 𝜓 𝑙 ) 과 𝑅.𝑢𝑝𝑝𝑒𝑟 (𝑡 𝜓 ℎ ) 를 모두 이진 탐색을 통해 $$ 𝑂 (log |𝑅 |)

시간에 계산할 수 있고, 따라서 𝑅.𝑐𝑛𝑡 (𝜓 )도 $$ 𝑂 (log |𝑅 |)

시간에 계산된다. 하지만 이 방법은 갱신에는 비효율적이다. 각 삽입이나 삭제마다 $$ 𝑂 (| 𝑅 |)

시간에 수행할 수 있으므로, 이 인덱스 구조는 로그 오버헤드로 동적 갱신을 효율적으로 지원한다. BST 구조와 저장된 크기를 사용하면, 임의의 튜플 𝑡 \in Z𝑑 에 대해 𝑅.𝑙𝑜𝑤𝑒𝑟 (𝑡 ) 와 𝑅.𝑢𝑝𝑝𝑒𝑟 (𝑡 ) 를 루트에서 리프까지의 순회를 통해 $$ 𝑂 (log |𝑅 |)

를 $$ 𝑂 (log |𝑅 |)

시간에 계산할 수 있다. 그러면 Lemma 5. For any prefix range filter 𝜓 and any fractional edge cover 𝑐 ∈ 𝐸𝐶 (𝐺 𝑄 ), both AGM 𝑐 (𝑄 |𝜓 ) and AGM (𝑄 |𝜓 ) can be calcu-lated in $$ 𝑂 (log |𝑄 |)

time.

따라서 임의의 prefix range filter 𝜓 에 대해 𝑢𝑝𝑝 (𝜓 ) = ⌊AGM 𝑐 (𝑄 |𝜓 )⌋

를 $$ 𝑂 (log |𝑄 |)

시간에 계산할 수 있다. 이제 우리는 𝑢𝑝𝑝 (𝜓 ) \leq 1일 때 조인 결과 𝑅𝑒𝑠 (𝑄 |𝜓 )를 $$ 𝑂 (log |𝑄 |)

시간에 계산할 수 있음을 증명한다. Property 1 (super-additivity). Given any range filter 𝜓 = [[ 𝑙 1, ℎ 1], . . . , [𝑙 𝑛 , ℎ 𝑛 ]] and 1 \leq 𝑝 \leq 𝑛 , for any partition of the inter-val [𝑙 𝑝 , ℎ 𝑝 ] into 𝑘 disjoint sub-intervals 𝐼 1, . . . , 𝐼 𝑘 such that [𝑙 𝑝 , ℎ 𝑝 ] =⋃︁ > 𝑘 𝑖 =1 𝐼 𝑖 and 𝐼 𝑖 \cap𝐼 𝑗 = \emptyset for 𝑖 \neq 𝑗 , the inequality \sum︁ 𝑘 𝑖 =1 𝑢𝑝𝑝 ([[ 𝑙 1, ℎ 1], . . . , 𝐼 𝑖 , . . . , [𝑙 𝑛 , ℎ 𝑛 ]]) \leq 𝑢𝑝𝑝 (𝜓 ) holds. 상한 알고리즘이 Property 1을 만족하면 이를 super-additive라고 부른다. 그러면 다음 보조정리가 성립한다. Lemma 6. If 𝑢𝑝𝑝 is super-additive, then for any prefix range filter 𝜓 = [[ 𝑙 1, ℎ 1], . . . , [𝑙 𝑛 , ℎ 𝑛 ]] such that 𝑢𝑝𝑝 (𝜓 ) \leq 1, Res (𝑄 |𝜓 ) can be computed in $$ 𝑂 (log |𝑄 |)

time.

Res (𝑄 |𝜓 )를 $$ 𝑂 (log |𝑄 |)

시간에 계산할 수 있다. ## 4.4 자식 탐색 알고리즘 RRAccess 의 경로 탐색 과정에서, 방문한 각 노드의 자식을 $$ 𝑂 (log |𝑄 |)

에서 $$ 𝑂 (log |𝑄 |)

로 줄인다.

divide 연산. 구체적으로 “di-vide” 연산을 정의한다. 이 연산은 𝑠 =

𝑠

, 𝑟 ′

𝑠

], . . . , [𝑙 𝑛 , ℎ 𝑛 ]] 이며, 여기서 [𝑙 ′

𝑠

, 𝑟 ′

𝑠

]

가 된다. 반면 우리는 prefix range filter를 나눌 때 분할점 𝑝 를 $$ 𝑂 (log |𝑄 |)

Lemma 8. Algorithm 4 returns the maximum integer 𝑝 ∗ such that

𝐹 (𝑝 ∗) ≤ 𝑇 in $$ 𝑂 (log ∑︁ 𝑘 𝑖 =1 |𝐴 𝑖 |)

time. \sum︁ 𝑘 𝑖 =1 |𝐴 𝑖 | \leq \sum︁ 𝑘 𝑖 =1 |𝑅 𝑖 | \leq | 𝑄 | 이므로, 즉시 Corollary 1. The divide operation on any prefix range filter can be performed in $$ 𝑂 (log |𝑄 |)

time.

x y

𝜓

children

x y

𝜓 1

𝜓 2

𝜓 3

𝜓 4

𝜓 5

𝜓 6 𝜓 7

Figure 2: 𝜓 의 𝑄 Δ에서의 분할.

Algorithm 5: 𝑐ℎ𝑖𝑙𝑑𝑟𝑒𝑛

Input: 𝜓

Output: a list of filters

1

if 𝑢𝑝𝑝 (𝜓 ) ≤ 1 then return ∅;

2

𝑟𝑒𝑠 ← ∅ ;

3

divide 𝜓 into 𝜓 left ,𝜓 mid ,𝜓 right ;

4

if 𝑢𝑝𝑝 (𝜓 left ) > 0 and 𝜓 left is not empty then

5

𝑟𝑒𝑠 ← 𝑟𝑒𝑠 ∪ { 𝜓 left }

6

if 𝑢𝑝𝑝 (𝜓 mid ) = 1 then 𝑟𝑒𝑠 ← 𝑟𝑒𝑠 ∪ { 𝜓 mid };

7

else 𝑟𝑒𝑠 ← 𝑟𝑒𝑠 ∪ 𝑐ℎ𝑖𝑙𝑑𝑟𝑒𝑛 (𝜓 mid );

8

if 𝑢𝑝𝑝 (𝜓 right ) > 0 and 𝜓 right is not empty then

9

𝑟𝑒𝑠 ← 𝑟𝑒𝑠 ∪ { 𝜓 right }

10

return res; 그러면 임의의 prefix range filter 𝜓 에 대해, 𝑐ℎ𝑖𝑙𝑑𝑟𝑒𝑛 (𝜓 )는 Algorithm 5와 같이 재귀 방식으로 $$ 𝑂 (log |𝑄 |)

시간에 계산할 수 있다. 재귀 깊이는 최대 𝑑 이므로, Algorithm 5는 최대 2𝑑 + 1 \leq $$ 𝑂 (1)

⌊AGM 𝑐 ∗ (𝑄 |𝜓 )⌋ 이고 𝑐 ∗ (𝑅 ) = 𝑐 ∗ (𝑆 ) = 𝑐 ∗ (𝑇 ) = 12 라고 하자.

Lemma 9. For any prefix range filter 𝜓 , let 𝜓 left , 𝜓 mid and 𝜓 right

d denote the three filters obtained by dividing 𝜓 , then all non - empty ranges among these filters are prefix range filters.

루트 노드의 필터(즉 𝜓 𝑟 )가 prefix range filter이므로, 귀납적으로 다음이 따른다.

Corollary 2. For any node 𝑢 ∈ 𝑇 ˜ 𝑄 , 𝜓 𝑢 is a prefix range filter.

4.5 거의 최적의 REnum 알고리즘

위 구현들은 REnum 성능에 대한 이론적 보장을 제공한다. 다음 정리는 𝑁 = 𝑢𝑝𝑝 (𝜓 𝑟 )

이고 임의의 구간 필터 𝜓 에 대해 𝑢𝑝𝑝 (𝜓 ) =⌊︁ AGM 𝑐 ∗ (𝑄 |𝜓 )⌋︁ 로 두었을 때 Algorithm 2를 분석함으로써 증명할 수 있다.

896 Theorem 3. There exists a constructive random-order enumeration algorithm for join queries with expected $$ 𝑂 ( AGM (𝑄 )|Res (𝑄 ) |+ 1 log 2 |𝑄 |)

delay and $$ 𝑂 (AGM (𝑄 ) log |𝑄 |)

total running time, after an $$ 𝑂 (| 𝑄 | log |𝑄 |)

-time index construction phase. Theorem 2와 [ 13 ]의 결과는 조합적 𝑘 -clique 가설 하에서, $$ 𝑂 (| 𝑄 | log |𝑄 |)

시간 인덱스 구축 단계 후 Algorithm 2의 기댓값 지연과 총 실행 시간이 모두 거의 최악의 경우 최적임을 보여준다.

4.6 공간 사용량

우리 알고리즘의 공간 복잡도는 두 구성요소가 지배한다: (1) ban-pick tree, (2) 캐시된 RRATree 구조. ban-pick tree와 RRATree 모두 최대

𝑂 (AGM (𝑄 )) 개의 노드를 포함하고, 각 노드는 평균적으로 $$ 𝑂 (1)

공간을 차지하므로, 전체 공간 복잡도는 $$ 𝑂 (AGM (𝑄 ))

금지 구간 병합. 새로운 구간 𝐼 를 금지할 때,

5 열거 가속

5.1 더 큰 자명 구간 발견

필터의 자명 구간. 𝜑 ∗

𝑄

𝜓 1, . . . ,𝜓 𝑘 를 만족하면 𝑢𝑝𝑝 (𝜓 ) ≥ ∑︁ 𝑘 𝑖 =1 𝑢𝑝𝑝 (𝜓 𝑖 ) 이다. 따라서 어떤 정수 𝑖 가

(오프셋 제거 후) (∑︁ 𝑘 𝑖 =1 𝑢𝑝𝑝 (𝜓 𝑖 ), 𝑢𝑝𝑝 (𝜓 )] 안에 들어가면, 𝜑 ∗

𝑄

𝜑 ∗

𝑄

(𝑡 ) =⊥ 이므로, 필터 𝜓 의 자명 구간을

𝐼 𝜓 =

⎡⎢⎢⎢⎢⎣

offset +

𝑘

∑︂

𝑗 =1

𝑢𝑝𝑝 (𝜓 𝑘 ) + 1, offset + 𝑢𝑝𝑝 (𝜓 )

⎤⎥⎥⎥⎥⎦

에 대해, 𝜓 ′ ∈ 𝑐ℎ𝑖𝑙𝑑𝑟𝑒𝑛 (𝜓 ) 를 𝜓 의 마지막 자식이라 하자. 그러면 구간

𝐼 𝜓 와 𝐼 𝜓 ′ 는 서로 연속된다. 예를 들어 𝑇 ˜ 𝑄 Δ (Figure 1)에서 루트 필터 𝜓 𝑟 의 마지막 자식은 𝜓 ′

𝑟

= [[ 4, 4], [1, 4], [1, 4]] 이고, 따라서 자명 구간 𝐼 𝜓 ′

𝑟

시간에 병합된 자명 구간을 얻을 수 있다. 그 결과 열거 과정 중 RRAccess 호출 횟수가 줄어 실제 성능이 향상된다. 또한 열거 과정 중 병합된 두 개의 897 자명 구간이 서로 겹치지 않음을 증명할 수 있다. 우리는 기본 LTI의 이 변형(merging trivial intervals, MTI)을 Section 6에서 평가한다. 배치 자명 구간 발견. RRAccess 호출 수를 더 줄이기 위해, 우리는 MTI 기법을 강화하여 한 번의 RRAccess 실행 안에서 여러 개의 자명 구간을 발견하고 보고하도록 한다. 구체적으로 RRATree의 위에서 아래로의 순회 경로를 따라, 방문한 각 노드의 자명 구간을 계산하고 그 마지막 자식의 사슬을 재귀적으로 탐색한다. 이 경로를 따라 발견된 모든 자명 구간은 가능할 때 병합되어 Ban-Pick Tree에 보고된다. 이 방식으로, 열거 지연은 $$ 𝑂 ( AGM (Q)|𝑅𝑒𝑠 (𝑄 ) | log 3 |𝑄 |)

로 증가하지만, 총 실행 시간은 여전히

𝑂 (AGM (𝑄 ) log |𝑄 |)

이며, 열거 과정 중 RRAccess 호출 횟수는 줄어든다. 우리는 MTI의 이 변형(batch trivial interval discovery, BTI)을 Section 6에서 평가한다.

5.2 더 타이트한 상한 추정

|𝑅 |𝜓 | = |𝑇 |𝜓 | = 1 이고 |𝑆 |𝜓 | = 4 이다. 그러면 𝑢𝑝𝑝 (𝜓 ) = ⌊AGM (𝑄 Δ |𝜓 )⌋ =

Lemma 10. If the upper-bound algorithms 𝑢𝑝𝑝 1, . . . , 𝑢𝑝𝑝 𝑐 are super-additive, then the upper-bound algorithm 𝑢𝑝𝑝 ∗, where ∀𝜓 ,

𝑢𝑝𝑝 ∗ (𝜓 ) = min 𝑐 𝑖 =1 𝑢𝑝𝑝 𝑖 (𝜓 ), is also super-additive.

따라서 𝑢𝑝𝑝 ∗ 를 Section 4에서 제시한 상한 알고리즘의 대체물로 사용할 수 있다.

시간에 계산한 뒤 선형계획법을 풀어 $$ 𝑂 (1)

𝜓 = [[ 4, 4], [1, 4], [1, 4]] 를 보자. 𝑐 ∈ 𝐸𝐶 (𝑄 Δ) 이고 𝑐 (𝑅 ) = 𝑐 (𝑇 ) = 1 및

AGM 𝑐 (𝑄 ∗

𝑟

|𝜓 ), where 𝑄 ∗

𝑟

= {𝑅 [att (𝑄 𝑟 ) \ att (𝑄 𝑠 )]| 𝑅 ∈ 𝑄 𝑟 }, and for any attribute set 𝑉 ⊆ att (𝑅 ), 𝑅 [𝑉 ] = {𝑡 [𝑉 ]| 𝑡 ∈ 𝑅 }.

열거 전에 𝑄 ∗

𝑟

에 대해 Section 4에서 설명한 인덱스를 구축하므로, 임의의 𝜓 에 대해 AGM 𝑐 (𝑄 ∗

𝑟

|𝜓 )를 $$ 𝑂 (log |𝑄 |)

시간에 계산할 수 있다. |𝑅𝑒𝑠 (𝑄 𝑠 |𝜓 )| 에 대해서는 각 관계 𝑅 = {𝑡 1, . . . , 𝑡 |𝑅 | }가 사전식으로 정렬되어 있다고 가정하고, 각 𝑅 \in 𝑄 𝑠 에 대해 배열 𝐴 𝑅 및 그 prefix-sum 배열을 계산한다. 모든 1 \leq 𝑖 \leq | 𝑅 | 에 대해, 𝐴 𝑅 [𝑖 ] = |⋈︁ 𝑅 ' \in𝑇 𝑅 𝑅 ' ⋉ 𝑡 𝑖 | 이며, 여기서 𝑇 𝑅 는 𝑄 𝑠 의 조인 트리에서 𝑅 를 루트로 하는 부분트리를 뜻한다. 이러한 배열은 [ 27 ]에서 설명한 것과 유사한 동적 계획법으로 계산할 수 있으며, 시간은 $$ 𝑂 (| 𝑄 | log |𝑄 |)

시간에 효율적으로 계산할 수 있다. 이어서 |𝑅𝑒𝑠 (𝑄 𝑠 |𝜓 )| 는 𝑄 의 모든 𝑅 \in 𝑄 에 대한 이러한 기수를 사용해 $$ 𝑂 (1)

시간에 계산할 수 있다. 이 방법은

898 질의별 전처리로 $$ 𝑂 (| 𝑄 | log |𝑄 |)

Towards Efficient Random-Order Enumeration for Join Queries

조인 질의를 위한 효율적인 무작위 순서 열거를 향하여

Pengyu Chen

Zizheng Guo

Jianwei Yang

Dongjing Miao

초록

2 기초

2.1 조인 질의

2.2 AGM 경계

2.4 무작위 순서 열거

3 열거 프레임워크 개요

3.1 Relaxed Random-Access 알고리즘

3.3 열거 프레임워크

⊥ ⊥ ⊥ ⊥ ⊥Figure 1: 𝑇 ˜ 𝑄 Δ when 𝑢𝑝𝑝 (𝜓 ) = ⌊AGM 𝑐 ∗ (𝑄 Δ |𝜓 )⌋

4.5 거의 최적의 REnum 알고리즘

4.6 공간 사용량

5 열거 가속

5.1 더 큰 자명 구간 발견

5.2 더 타이트한 상한 추정

관련 추천 글

StarRocks 내부: 예상보다 조인이 더 빠른 이유

스킵리스트는 어디에 쓸모가 있을까?

비용 기반 SQL 옵티마이저를 어떻게 만들었는가

CockroachDB의 쿼리 옵티마이저 (2020)

조인 질의를 위한 효율적인 무작위 순서 열거를 향하여

Pengyu Chen

Zizheng Guo

Jianwei Yang

Dongjing Miao

초록

2 기초

2.1 조인 질의

2.2 AGM 경계

2.4 무작위 순서 열거

3 열거 프레임워크 개요

3.1 Relaxed Random-Access 알고리즘

3.3 열거 프레임워크

⊥ ⊥ ⊥ ⊥ ⊥Figure 1: 𝑇 ˜ 𝑄 Δ when 𝑢𝑝𝑝 (𝜓 ) = ⌊AGM 𝑐 ∗ (𝑄 Δ |𝜓 )⌋

4.5 거의 최적의 REnum 알고리즘

4.6 공간 사용량

5 열거 가속

5.1 더 큰 자명 구간 발견

5.2 더 타이트한 상한 추정

관련 추천 글

StarRocks 내부: 예상보다 조인이 더 빠른 이유

스킵리스트는 어디에 쓸모가 있을까?

비용 기반 SQL 옵티마이저를 어떻게 만들었는가

CockroachDB의 쿼리 옵티마이저 (2020)