본문 바로가기
코테 스터디 99클럽

99클럽 코테 스터디 10일차 TIL + 힙

by leelisa 2024. 8. 1.

오늘의 문제 - 힙

문제 설명

이중 우선순위 큐는 다음 연산을 할 수 있는 자료구조를 말합니다.

이중 우선순위 큐가 할 연산 operations가 매개변수로 주어질 때, 모든 연산을 처리한 후 큐가 비어있으면 [0,0] 비어있지 않으면 [최댓값, 최솟값]을 return 하도록 solution 함수를 구현해주세요.

 

제한 사항

  • operations는 길이가 1 이상 1,000,000 이하인 문자열 배열입니다.
  • operations의 원소는 큐가 수행할 연산을 나타냅니다.
  • 원소는 “명령어 데이터” 형식으로 주어집니다.- 최댓값/최솟값을 삭제하는 연산에서 최댓값/최솟값이 둘 이상인 경우, 하나만 삭제합니다.
  • 빈 큐에 데이터를 삭제하라는 연산이 주어질 경우, 해당 연산은 무시합니다.

입출력 예


내 풀이 및 접근 방식

heap을 이용해서 풀이했으나 테스트케이스6~10에서 실패

import heapq

def solution(operations):

    heap = []
    heapq.heapify(heap)
    for op in operations:
        cmd, data = op.split()	# cmd: 명령어, data: 값
        
        if cmd == 'I':	# 새로운 값 추가
            heapq.heappush(heap, int(data))
        elif cmd == 'D' and data == '1' and heap:	# 최댓값 삭제
            heap.pop()
        elif cmd == 'D' and data == '-1' and heap:	# 최솟값 삭제
            heapq.heappop(heap)

    if heap:	# 힙이 비어있지 않은 경우
        return [heap.pop(), heapq.heappop(heap)]	# [최댓값, 최솟값] 출력
    else:
        return [0, 0]

 

실패 원인은 힙의 특징을 잘못 이해한 것이다. 최소 힙에서 가장 마지막 인덱스가 항상 가장 큰 값이라고 착각했다. 최소 힙에서 자식 노드는 부모 노드만 작다는 특징을 가지고 있고, 왼쪽 노드와 오른쪽 노드 값의 크기는 순서가 없다.

출처 https://velog.io/@holicme7/%EC%9E%90%EB%A3%8C%EA%B5%AC%EC%A1%B0-%ED%9E%99heap-ktk49na9c3

 

여기서 최댓값 삭제 로직 수정이 필요했는데, 최소 힙 만으로는 최댓값 찾고 삭제하는 것이 쉽지 않은 것 같아, 최대 힙을 추가로 생성하여 구하는 것의 필요성을 느꼈다.

 

아래는 최소 힙(heap)과 최대 힙(max_heap)을 생성한 풀이다.

import heapq

def solution(operations):

    heap = []
    max_heap = []
    heapq.heapify(heap)
    heapq.heapify(max_heap)
    for op in operations:
        cmd, data = op.split()
        
        if cmd == 'I':
            heapq.heappush(heap, int(data))
            heapq.heappush(max_heap, -int(data))	# 값에 - 붙이고 추가하여 최대 힙 구현
        elif cmd == 'D' and data == '1' and max_heap:
            max_v = heapq.heappop(max_heap)	# 최대 힙에서 최댓값 삭제
            heap.remove(-max_v)	# 최소 힙에서 최댓값 삭제
        elif cmd == 'D' and data == '-1' and heap:
            min_v = heapq.heappop(heap)	# 최소 힙에서 최솟값 삭제
            max_heap.remove(-min_v)	# 최대 힙에서 최솟값 삭제

    if heap:
        return [-heapq.heappop(max_heap), heapq.heappop(heap)]
    else:
        return [0, 0]

 

달라진 점은, 최댓값을 삭제할 때 최대 힙에서 최댓값을 삭제하고 최댓값에 해당하는 값을 최소 힙에서 삭제하고, 최솟값을 삭제할 때 최소 힙에서 최솟값을 삭제하고 최솟값에 해당하는 값을 최대 힙에서 삭제한다는 점이다.

위의 결과로 최소 힙과 최대 힙은 같은 숫자를 포함하고 있을 수 있다.


회고

힙의 특징 - 부모 노드보다 작지만 않으면 된다, 크지만 않으면 된다 + 완전이진트리이다. 외우자~~

완전이진트리는 왼쪽부터 차례대로 삽입하는 트리!!

힙에 새로운 값을 삽입하면 가장 끝에 값이 추가되고, 부모 노드와 비교하면서 올라가는 방식.

힙 값을 삭제하면 가장 마지막에 있는 값이 루트 노드로 올라오고, 자식 노드와 비교하면서 내려가는 방식. 이때 자식 노드 중 가장 작은 값이랑 위치 변경해야함.

이중 우선순위 큐

기본 큐와의 차이점으로 데어트를 삭제할 때, 연산 명령에 따라 우선순위가 가장 높거나 낮은 데이터를 삭제할 수 있다는 점이 있다. => 최대 힙과 최소 힙 모두 구현

 

최대 힙 구현은 값을 추가할 때 -붙이는 방법도 있지만, (-item, item)을 추가하는 방법도 있음. 첫번째 원소를 기준으로 힙 정렬됨.

 

 

백준 관련 문제

https://www.acmicpc.net/problem/7662