[알고리즘] JavaScript로 구현하는 DFS

2022년 3월 29일

dfs에 대해 알아보기 전에 우선 그래프에 대한 이해가 필요하다. 그래프에 대한 설명은 여기에 자세히 정리해두었다.

DFS란?

DFS(Depth-First-Search)는 깊이 우선 탐색이라고 하며 그래프에서 깊은 부분을 우선으로 탐색하는 알고리즘이다. DFS는 트리에서 생각하면 이해하기 쉽다(트리도 그래프의 일종이다). 트리를 탐색할 때 시작 노드에서 한 방향으로 계속 탐색하다가 더 이상 갈 수 없을 때 다시 가장 가까운 노드로 되돌아와 다시 탐색을 진행하는 방법과 유사하다.

DFS를 구현하는 데는 2가지의 방법이 있다. 첫 번째는 재귀를 이용하는 것이고 두 번째는 스택(반복문)을 이용하는 것이다.

재귀를 이용한 DFS(Recursive DFS)

동작 방식

방문 여부를 기록하기 위해 배열 visited를 사용하며, 배열 visited의 값을 false로 초기화한다.
노드를 방문할 때마다 해당 노드의 visited 배열 값을 true로 변경한다.
해당 노드(v)와 연결된 노드 중에 방문하지 않은 노드(node)이 있다면 방문하지 않은 노드(node)를 시작점으로 하여 DFS를 다시 시작한다.

코드 구현

dfs그래프


function dfs(graph, v, visited) {
  // 현재 노드를 방문 처리
  visited[v] = true;
  console.log(v);

  // 현재 노드와 연결된 다른 노드를 재귀적으로 방문
  for (let node of graph[v]) {
    if (!visited[node]) {
      dfs(graph, node, visited);
    }
  }
}

const graph = [[1, 2, 4], [0, 5], [0, 5], [4], [0, 3], [1, 2]];
const visited = Array(7).fill(false);

dfs(graph, 0, visited);
// 0 1 5 2 4 3

스택을 이용한 DFS(Iterative DFS)

동작 방식

스택에 시작 노드를 push 한다.
스택에서 노드를 pop하고 해당 노드(v)가 방문하지 않은 노드라면 방문처리 한다.
노드(v)와 연결된 노드 중에서 방문하지 않은 노드(node)이 있다면 stack에 push 한다.
스택의 길이가 0이 될 때까지 2, 3번 과정을 반복한다.

그림을 통해 먼저 구현과정을 보자. 아래 그래프를 DFS로 탐색할 것이다. 인접한 노드 중에서 방문하지 않은 노드가 여러 개 있으면 숫자가 큰 노드부터 탐색(스택으로 구현하기 때문에)한다고 가정한다.

dfs그래프

시작 노드인 0을 스택에 삽입한다.

dfs-step1

스택에서 0을 제거하고 방문 처리를 한다. 0 노드의 방문하지 않은 인접 노드 1, 2, 4를 스택에 삽입한다.

dfs-step2

스택의 제일 상위에 있는 4를 제거하고 방문 처리를 한다. 4 노드의 방문하지 않은 인접 노드 3을 스택에 삽입한다.

dfs-step3

스택에서 3을 제거하고 방문 처리를 한다. 노드 3의 방문하지 않은 인접 노드는 없으므로 무시된다.

dfs-step4

스택에서 2를 제거하고 방문 처리를 한다. 노드 2의 방문하지 않은 인접 노드 5를 스택에 삽입한다.

dfs-step5

스택에서 5를 제거하고 방문 처리를 한다. 노드 5의 방문하지 않은 인접 노드 1을 스택에 삽입한다.

dfs-step6

스택에서 1을 제거하고 방문 처리를 한다. 노드 1의 방문하지 않은 인접 노드는 없으므로 무시된다.

dfs-step7

스택에서 1을 제거한다. 노드 1은 이미 방문한 노드이므로 무시된다.

dfs-step8

결과적으로 그래프의 탐색 순서는 다음과 같다.
0 → 4 → 3 → 2 → 5 → 1

코드 구현


function dfs(graph, start, visited) {
  const stack = [];
  stack.push(start);

  while (stack.length) {
    let v = stack.pop();
    if (!visited[v]) {
      console.log(v);
      visited[v] = true;

      for (let node of graph[v]) {
        if (!visited[node]) {
          stack.push(node);
        }
      }
    }
  }
}
const graph = [[1, 2, 4], [0, 5], [0, 5], [4], [0, 3], [1, 2]];
const visited = Array(7).fill(false);

dfs(graph, 0, visited);
// 0 4 3 2 5 1

출력된 결과를 보면 Recursive DFS는 사전식 순서로 방문한 데 반해 와 Iterative DFS는 역순으로 방문한 것을 알 수 있다. 이는 Iterative DFS가 스택으로 구현하다 보니 가장 마지막에 삽입된 노드부터 꺼내서 반복하게 되고 인접 노드를 한꺼번에 추가하기 때문에 가장 마지막에 스택에 담긴 노드부터 방문하기 때문이다. 두 경우 모두 DFS 알고리즘에 따라 정상적으로 모든 노드의 방문을 마쳤기 때문에 잘못된 결과가 아니다.

DFS의 기능을 생각하면 순서와 상관없이 처리해도 되지만, 코딩 테스트에서는 번호가 낮은 순서부터 처리하도록 명시하는 경우가 종종 있다. 따라서 관행적으로 번호가 낮은 순서부터 처리하도록 구현하는 편이다.

스택을 사용한 DFS의 문제점

파이썬은 sys.setrecursionlimit을 사용하여 재귀의 최대 깊이를 설정할 수 있어서 재귀를 사용한 DFS(이하 Recursive DFS)로 문제를 풀더라도 대부분 해결된다. 하지만 자바스크립트는 그런거 없다.🥲 문제를 해결하기 위해서는 스택을 이용한 DFS(이하 Iterative DFS)를 이용해야 한다.

그런데 Iterative DFS를 사용할 때 Recursive DFS와 같이 동작하지 않는 부분이 있다. 그것은 바로 부모 노드로 되돌아가는 로직이다.

그게뭔데 10덕아..

보통 DFS를 이용해야 하는 알고리즘 문제를 풀다보면 단순히 탐색 하면서 리프 노드부터 부모 노드로 연산을 수행(값을 전달)가 있다. Recursive DFS는 함수의 호출 스택이 쌓이다가 리프 노드에 도달하면 연산을 수행하고 함수 호출 스택이 하나씩 사라지면서 부모 노드로 돌아가는 로직이 자연스럽게 수행된다.


function dfs(graph, v, visited) {
  visited[v] = true;
  console.log(v);

  for (let node of graph[v]) {
    if (!visited[node]) {
      dfs(graph, node, visited);
    }
  }
  // 여기가 리프 노드에서 부모 노드로 연산을 수행하는 부분이다.
}

코드를 보면 노드 v의 모든 인접 노드에 대한 재귀 호출이 종료된 후(즉, for 문이 완전히 종료된 후)에는 노드 v와 그 하위의 모든 노드들에 대한 탐색이 완료된 상태다. 그럼 노드 v는 어떤 노드일까? 바로 이전에 dfs 함수를 호출했던 노드의 인접 노드 중 하나다. 이전에 dfs 함수를 호출했던 노드를 "부모 노드"라고 볼 수 있으므로, 이 시점에서 노드 v는 리프 노드부터 시작하여 해당 부모 노드까지의 연산을 수행할 수 있는 시점이 된다.

따라서, for 문 이후의 코드는 리프 노드부터 시작하여 해당 부모 노드까지의 연산을 수행하는 부분이다.

이 부분(부모 노드로 돌아가는 로직)이 Iterative DFS에는 존재하지 않는다. 스택의 상단에 있는 노드(즉, 가장 최근에 추가된 노드)를 계속 탐색하기 때문에 현재 노드의 부모 노드로 돌아가는 로직이 없다. 따라서 Iterative DFS가 Recursive DFS와 같이 동작하도록 하려면 부모 노드로 돌아가는 로직을 추가해줘야 한다.

개선된 Iterative DFS

Recursive DFS와 같이 동작하도록 Iterative DFS 코드를 개선해보자. 직관적으로 부모 노드를 추적할 수 있도록 부모 노드를 stack에 함께 넣어주면 된다. 첫 번째 원소는 현재 노드, 두 번째 원소는 부모 노드를 넣어주면 된다. 루트 노드의 경우 부모 노드가 없으므로 -1, null, undefined 등 존재할 수 없는 수를 넣어주자.


function dfs(graph, visited) {
  // 루트 노드는 부모가 없으므로 -1, null, undefined 등 존재할 수 없는 수를 넣어준다.
  const stack = [[0, -1]];

  while (stack.length) {
    // 구조 분해를 통해 현재 노드와 부모 노드를 선언
    let [cur, parent] = stack.pop();

    ...

    // stack 다시 push해준다.
    stack.push([cur, parent]);

    ...

  }
}

부모 노드를 추적하고 부모 노드로 되돌아가는 로직을 수행하기 위해 스택에서 pop하고 다시 push를 해주는 작업을 하게 된다. 이때 유의할 점이 pop 이후에 이미 방문한 노드를 바로 push 하면 무한루프에 빠질 수 있다. 따라서 pop과 push 사이에 조건을 넣어줘야 한다. 이 부분이 기존의 Iterative DFS에서 빠져 있던 부분이고 Recursive DFS와 같게 만들어 주는데 필요한 로직이다.

이미 방문한 노드라는 것은 리프 노드이거나 더 이상 탐색할 노드가 없는 노드라는 것을 의미한다. 따라서 아래 코드의 if (visited[cur]) 코드 블록은 Recursive DFS의 for문이 종료된 후에 수행되는 부분과 같다.


function dfs(graph, visited) {
  const stack = [[0, -1]];

  while (stack.length) {
    let [cur, parent] = stack.pop();

    if (visited[cur]) {
      // 이 부분이 기존의 Iterative DFS에서 빠져 있던 부분이고
      // Recursive DFS와 같게 만들어 주는데 필요한 로직이다.
      continue;
    }

    stack.push([cur, parent]);
    visited[cur] = true;

    console.log(cur);

    // 방문하지 않았던 노드라면 `cur`은 부모 노드가 되어 다음 노드를 계속 탐색하게 된다.
    for (const node of graph[cur]) {
      if (!visited[node]) stack.push([node, cur]);
    }
  }
}

개선된 Iterative DFS의 동작 과정 그림으로 통해 알아보자.

시작 노드인 0을 스택에 삽입한다. 이때 0은 루트 노드(부모가 없는 노드)이므로 부모노드는 -1,undefined,null과 같은 존재하지 않는 수를 넣어준다. 이 예제에서는 -1을 부모 노드로 삽입한다.

dfs2-step1

스택에서 [0, -1]을 제거하고 방문한 노드인지 체크한다. 노드 0은 방문하지 않은 노드이므로 다시 스택에 삽입하고 방문처리를 한다. 0 노드의 방문하지 않은 인접 노드 1, 2, 4를 부모 노드인 0과 함께 [1, 0], [2, 0], [4, 0] 형태로 스택에 삽입한다.

dfs2-step2

스택의 제일 상위에 있는 [4, 0]을 제거하고 방문한 노드인지 체크한다. 노드 4는 방문하지 않은 노드이므로 다시 스택 삽입하고 방문처리를 한다. 4 노드의 방문하지 않은 인접 노드 3을 부모 노드인 4와 함께 [3, 4] 형태로 스택에 삽입한다.

dfs2-step3

스택에서 [3, 4]를 제거하고 방문한 노드인지 체크한다. 노드 3은 방문하지 않은 노드이므로 다시 스택에 삽입하고 방문처리를 한다. 노드 3의 인접 노드 중에 방문하지 않은 노드가 없으므로 다음 과정은 무시된다.

dfs2-step4

스택에서 [3, 4]를 제거한다. 노드 3은 방문한 노드이므로 다음 과정은 무시하고 다음 반복으로 넘어간다.

dfs2-step5

스택에서 [4, 0]를 제거한다. 노드 4는 방문한 노드이므로 다음 과정은 무시하고 다음 반복으로 넘어간다.

dfs2-step6

스택에서 [2, 0]를 제거한고 방문한 노드인지 체크한다. 노드 2는 방문하지 않은 노드이므로 다시 스택 삽입하고 방문처리를 한다. 2 노드의 방문하지 않은 인접 노드 5를 부모 노드인 2와 함께 [5, 2] 형태로 스택에 삽입한다.

dfs2-step7

스택에서 [5, 2]를 제거하고 방문한 노드인지 체크한다. 노드 5는 방문하지 않은 노드이므로 다시 스택에 삽입하고 방문처리를 한다. 노드 5의 방문하지 않은 인접 노드 1을 부모 노드인 5와 함께 [1, 5] 형태로 스택에 삽입한다.

dfs2-step8

스택에서 [1, 5]를 제거하고 방문한 노드인지 체크한다. 노드 1은 방문하지 않은 노드이므로 다시 스택에 삽입하고 방문처리를 한다. 노드 1의 인접 노드 중에 방문하지 않은 노드가 없으므로 다음 과정은 무시된다.

dfs2-step9

나머지 노드들은 모두 방문한 노드이므로 스택에서 하나씩 제거하고 반복이 종료된다.

dfs2-step10

DFS의 시간 복잡도

노드의 수가 $N$ 이고 간선의 수가 $E$ 인 그래프에서 그래프가 인접 리스트로 표현되어 있다면 $O(N+E)$ 이고, 인접 행렬로 표시되어 있다면 $O(N^2)$ 이다. 이는 희소 그래프인 경우 DFS는 인접 리스트의 사용이 인접 행렬보다 시간적으로 유리함을 의미한다.

참고

DFS란?

재귀를 이용한 DFS(Recursive DFS)

동작 방식

코드 구현

스택을 이용한 DFS(Iterative DFS)

동작 방식

코드 구현

스택을 사용한 DFS의 문제점

개선된 Iterative DFS

DFS의 시간 복잡도

참고

Kihoon

기록하는 프론트엔드 개발자

이전 포스트

JavaScript: let, const 키워드

다음 포스트

[알고리즘] JavaScript로 구현하는 BFS