honey_pot

[최단 경로] 9 - 1 (1) 다익스트라 최단 경로 알고리즘 본문

이것이 코딩테스트다

[최단 경로] 9 - 1 (1) 다익스트라 최단 경로 알고리즘

_tera_ 2021. 6. 19. 15:29

최단 경로 ( Shortest Path)

  • 가장 짧은 경로를 찾는 알고리즘 ➡ 길 찾기 문제
  • 다익스트라 최단 경로 알고리즘
  • 플로이드 워셜 최단 경로 알고리즘

다익스트라(Dijkstra) 최단 경로 알고리즘

  • 그래프에서 여러 개의 노드가 있을 때, 특정한 노드에서 출발하여 다른 노드로 가는 각각의 최단 경로를 구하는 알고리즘
  • '음의 간선' 이 없을 때 정상적으로 동작 ( 음의 간선 ➡ 0보다 작은 값을 가지는 간선을 의미)
  • GPS 소프트웨어의 기본 알고리즘
  • '가장 비용이 적은 노드'를 선택해서 과정을 반복 ➡ 기본적으로 그리디 알고리즘으로 분류

알고리즘 원리

  1. 출발 노드를 설정한다.
  2. 최단 거리 테이블을 초기화한다.
  3. 방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드를 선택한다.
  4. 해당 노드를 거쳐 다른 노드로 가는 비용을 계산하여 최단 거리 테이블을 갱신한다.
  5. 위 과정에서 3과 4 번을 반복한다.
  • 각 노드에 대한 현재까지의 최단 거리 정보를 항상 1차원 리스트(최단 거리 테이블)에 저장하며 리스트를 계속 갱신한다.
  • 한 단계당 하나의 노드에 대한 최단 거리를 확실히 찾는다.

구현 방법 1. 간단한 다익스트라 알고리즘

  • O(V^2) (V : 노드의 개수)
  • 각 노드에 대한 최단 거리를 담는 1차원 리스트를 선언하고 단계마다 방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드를 선택하기 위해 매 단계마다 1차원 리스트의 모든 원소를 확인(순차 탐색)한다.
import sys

input = sys.stdin.readline
INF = int(1e9)  # 무한을 의미하는 값으로 10억을 설정

# 노드의 개수, 간선 개수를 입력받기
n, m = map(int, input().split())
# 시작 노드 번호 입력받기
start_node = int(input())

# 각 노드에 연결되어 있는 노드에 대한 정보를 담는 리스트 만들기
graph = [[] for i in range(n + 1)]
# 방문한 적이 있는지 체크하는 목적의 리스트 만들기
visited = [False] * (n + 1)
# 최단 거리 테이블을 모두 무한으로 초기화
distance = [INF] * (n + 1)

# 모든 간선 정보 입력받기
for _ in range(m):
    a, b, c = map(int, input().split())
    # a번 노드에서 b번 노드로 가는 비용이 c라는 의미
    graph[a].append((b,c))


# 방문하지 않은 노드 중에서, 가장 최단 거리가 짧은 노드의 번호를 반환
def get_smallest_node():
    min_value = INF
    index = 0  # 가장 최단 거리가 짧은 노드(인덱스)
    for i in range(1, n + 1):
        if distance[i] < min_value and not visited[i]:
            min_value = distance[i]
            index = i
    return index


def dijkstra(start_node):
    # 시작 노드에 대해서 초기화
    distance[start_node] = 0
    visited[start_node] = True
    for j in graph[start_node]:
        distance[j[0]] = j[1]
    # 시작 노드를 제외한 전체 n-1개의 노드에 대해 반복
    for i in range(n - 1):
        # 현재 최단 거리가 가장 짧은 노드를 꺼내서, 방문 처리
        current_node = get_smallest_node()
        visited[current_node] = True
        # 현재 노드와 연결된 다른 노드를 확인
        for j in graph[current_node]:
            cost = distance[current_node] + j[1]
            # 현재 노드를 거쳐서 다른 노드로 이동하는 거리가 더 짧은 경우
            if cost < distance[j[0]]:
                distance[j[0]] = cost


# 다익스트라 알고리즘 수행
dijkstra(start_node)

# 모든 노드로 가기 위한 최단 거리를 출력
for i in range(1, n + 1):
    # 도달할 수 없는 경우, -1 출력
    if distance[i] == INF:
        print(-1)
    else:
        print(distance[i])

 

 

입력되는 데이터 수가 많다고 가정 ➡ sys.std.readline 사용

모든 리스트의 크기는 (노드 개수 +1) 로 할당하여, 노드의 번호를 인덱스로 하여 바로 리스트에 접근할 수 있다.

 


구현 방법 2. 간단한 다익스트라 알고리즘

  • O(ElogV) (V : 노드의 개수, E : 간선의 개수)
  • 가장 작은 값을 꺼내는 최소 힙 자료구조 사용 (우선순위 큐 라이브러리 사용) ➡ 특정 노드까지의 최단 거리에 대한 정보를 힙에 담아서 처리 ➡ 출발 노드로부터 가장 거리가 짧은 노드를 찾는다. (로그 시간 소요)
우선순위 큐 구현 방식 삽입 시간 삭제 시간
리스트  O(1) O(N)
힙(Heap) O(logN) O(logN)
  • 최단 거리가 가장 짧으 ㄴ노드를 선택하는 과정을 다익스트라 최단 경로 함수 안에서 우선순위 큐를 이용하는 방식으로 대체할 수 있다. ➡ 1번 코드의 get_smallest_node() 함수를 쓰지 않아도 된다.

 

import sys
import heapq

input = sys.stdin.readline
INF = int(1e9)  # 무한을 의미하는 값으로 10억을 설정

# 노드의 개수, 간선 개수를 입력받기
n, m = map(int, input().split())
# 시작 노드 번호 입력받기
start_node = int(input())

# 각 노드에 연결되어 있는 노드에 대한 정보를 담는 리스트 만들기
graph = [[] for i in range(n + 1)]
# 방문한 적이 있는지 체크하는 목적의 리스트 만들기
visited = [False] * (n + 1)
# 최단 거리 테이블을 모두 무한으로 초기화
distance = [INF] * (n + 1)

# 모든 간선 정보 입력받기
for _ in range(m):
    a, b, c = map(int, input().split())
    # a번 노드에서 b번 노드로 가는 비용이 c라는 의미
    graph[a].append((b, c))


def dijkstra(start_node):
    q = []
    # 시작 노드로 가기 위한 최단 경로는 0으로 설정
    heapq.heappush(q, (0, start_node))
    distance[start_node] = 0
    while q:  # 큐가 비어있지 않다면
        # 가장 최단 거리인 노드에 대한 정보 꺼내기
        dist, cur_node = heapq.heappop(q)
        # 현재 노드가 이미 처리된 적이 있는 노드라면 무시
        if distance[cur_node] < dist:
            continue
        # 현재 노드와 연결된 다른 인접한 노드들을 확인
        for i in graph[cur_node]:
            cost = dist + i[1]
            # 현재 노드를 거쳐서, 다른 노드로 이동하는 거리가 더 짧은 경우
            if cost < distance[i[0]]:
                distance[i[0]] = cost
                heapq.heappush(q, (cost, i[0]))


dijkstra(start_node)

for i in range(1, n + 1):
    if distance[i] == INF:
        print(-1)
    else:
        print(distance[i])

 

 

  • 노드 V번 동안 각각 자신과 연결된 간선들을 모두 확인한다.
  • '현재 우선순위 큐에서 꺼낸 노드와 연결된 다른 노드들을 확인'하는 총횟수는 총 최대 간선의 개수(E)만큼 연산이 수행된다.
  • 이때 중복 간선을 포함하지 않는 경우, E는 항상 V^2 보다 작다. 모든 노드끼리 서로 연결되어 있다고 했을 때, 간선의 개수를 약 V^2로 볼 수 있고 E는 항상 V^2 이하이기 때문이다. ➡ logE는 log(V^2)보다 작다.

✨✨ O(log(V^2)) ➡ O(2logV) ➡ O(logV) ➡➡➡ 다익스트라 전체 시간 복잡도는 O(ElogV)

Comments