🌟 본 게시물은 이화여자대학교 반효경 교수님 강의를 참고로 작성한 게시물 입니다. 틀린 내용은 꼬옥 지적 부탁드립니다 ! 🌟

🗳️ Virtual Memory

물리적 메모리의 주소변환은 운영체제가 관여하지 않지만 Virtual Memory 기법은 운영체제가 관여한다.

1. Demand Paging

실제로 사용자 프로그램에선 자주 사용되지 않는 코드가 대부분이다.
Demand Paging 기법은 실제로 사용될 경우 메모리에 올리기 때문에 많은 프로세스를 메모리에 동시에 올릴 수 있다.
Demand Paging 기법에선 무조건 한번은 page fault가 발생한다. (참조될 경우에 메모리에 올리기 때문)
실제로 필요할 때 page를 메모리에 올리는 것
I/O 양의 감소
한정된 메모리 공간을 조금 더 효율적으로 사용할 수 있기 때문에 Disk 에서 읽어오는 일이 적어짐
Memory 사용량 감소
빠른 응답 시간
더 많은 사용자 수용
Valid / Invalid bit의 사용
Invalid 의 의미
사용되지 않는 주소 영역인 경우
페이지가 물리적 메모리에 없는 경우
처음에는 모든 page entry가 invalid로 초기화
address translation 시에 Invalid bit이 set되어 있으면
“page fault”

2. Page Fault

invalid page를 접근하면 MMU가 trap을 발생시킴 (page fault trap)
Kernel mode로 들어가서 page fault handler가 invoke됨
다음과 같은 순서로 page fault를 처리한다.
- invalid reference? (eg. bad address, protection violation) → abort process
- Get an empty frame (없으면 뺏어온다: 다른 페이지가 할당된 frame에 replace)
메모리를 획득하면 해당 페이지를 disk에서 momory로 읽어온다
- disk I/O가 끝나기까지 이 프로세스는 CPU를 preempt 당함 (block)
- Disk read가 끝나면 page tables entry 기록, valid/invalid bit = “vaild”
- ready queue에 process를 insert → dispatch later
- 이 프로세스가 CPU를 잡고 다시 running
- 아까 중단되었던 instruction을 재개

✔️ Steps in Handling a Page Fault

페이지 테이블 엔트리에 접근한다.
접근한 엔트리의 Invalid bit이 invalid이면 trap을 발생시킨다.
커널모드로 변경되어 page가 저장된 하드디스크에 접근한다.
page를 비어있는 page frame으로 이동시킨다. 이때 비어있는 page frame이 존재하지 않을경우 다른 페이지가 할당된 frame에 replace한다
새로 할당된 page frame number를 입력하고 invalid bit을 수정한다.
trap에 의해 중단되었던 명령어를 다시 수행한다.

✔️ Performace of Demand Paging

Page Fault Rate 0≤ p ≤ 1.0
- if p = 0 no page fault
- if p = 1, every reference is a fault
Effective Access Time
- (1 - p) x memory access + P (OS & HW page fault overhead
  - [swap page out if needed]
  - swap page in
  - OS & HW restart overhead)

🌟 실제로 시스템에서 Page Fault Rate를 조사해본 결과 0.09 값이 측정된다. 즉 대부분의 경우는 메모리에서 직접 주소변환이 이뤄진다는 것이다.

2.2 Empty Frame이 없는 경우

✔️ Page replacement

어떤 frame을 빼앗아올지 결정해야 함
곧바로 사용되지 않을 page를 쫓아내는 것이 좋음
동일한 페이지가 여러번 메모리에서 쫓겨났다가 다시 들어올 수 있음
운영체제의 역할

✔️ Replacement Algorithm

page-fault rate을 최소화하는 것이 목표
알고리즘의 평가
- 주어진 page reference string에 대해 page fault를 얼마나 내는지 조사
reference string
- 시간순서에 따라 나열된 page frame (참조된 순서로 나열됨)
- reference string의 예
  - 1, 2, 3, 4, 1, 2, 5, 1, 2, 3, 4, 5

✔️ Page Replacement 흐름

swap out할 victim page를 선점하여 backing store에 swap out시킨다. 이때 변경사항이 있으면 변경된 내용을 저장하고 swap out한다.
victim page가 저장되어있던 page table 엔트리의 valid/invalid bit를 invalid 로 수정한다
swap out이 완료되면 victim page가 존재하던 frame에 trap을 발생시킨 page를 할당한다.
새롭게 할당된 page가 존재하는 page table 엔트리의 frame number를 수정한다.

💡 victim page

page replacement에 의해 swap out 되는 페이지를 victim page 라고 한다

2.3 Optimal Algorithm

MIN(OPT): 가장 먼 미래에 참조되는 page를 replace

✔️ Optimal Alogrithm?

미래의 참조를 어떻게 아는가?
- 미래를 모두 짐작해야하기 때문에 Offline algorithm 실제로 사용되진 않음
다른 알고리즘 성능에 대한 upper bound 제공
- Belady’s optimal algorithm, MIN, OPT 등으로 불림

✔️ Optimal Alogrithm 예시

[ 가정 ]

빨간색 숫자는 page fault가 발생한 page
연보라색 숫자는 메모리로 바로 참조되는 page

[ 예시 ]

1,2,3,4번 page의 참조가 발생하여 메모리에 할당한다.
1번과 2번 page가 메모리에서 바로 참조된다.
다음 순서로 5번 page가 참조되어 page fault가 발생한다.
이때 page frame은 모두 꽉 차있는 상태이므로 swap out할 page를 선점한다.
가장 먼 미래에 참조되는 4번 page를 swap out한다.

2.4 FIFO (First In First Out) Algorithm

가장 먼저들어온 page를 내쫓는 알고리즘

✔️ FIFO Anomaly (Belady’s Anomaly)

more frames ≠ less page fault
frame이 많을수록 page fault가 더 자주 일어난다.

✔️ FIFO (First In First Out) Algorithm 예시

[가정]

빨간색 숫자는 page fault가 발생한 page
연보라색 숫자는 메모리로 바로 참조되는 page

[예시]

1,2,3 번 page가 참조되어 page fault가 발생한다.
그 이후 4번 page가 참조되어 가장 먼저 들어온 1번 page가 swap out되고 4번 page가 할당된다.
1번 page가 재참조되어 1번 다음으로 빨리 들어왔던 2번 page를 swap out하고 1번 page를 할당한다.
가장 먼저 할당되었던 page를 swap out하면서 반복

2.5 LRU (Least Recently Used) Algorithm

LRU : 가장 오래 전에 참조된 것을 swap out 시키는 알고리즘
가장 오래전에 참조된 알고리즘을 swap out하기 때문에 swap out 되는 page의 인지도는 체크하지 않는다. (여러번 참조되었냐의 여부 확인 안함)

✔️ LRU (Least Recently Used) Algorithm 예시

[가정]

빨간색 숫자는 page fault가 발생한 page
연보라색 숫자는 메모리로 바로 참조되는 page

[예시]

1,2,3,4 번 page가 참조되어 page fault가 발생한다.
1번과 2번 page를 직접 메모리에서 참조한다.
5번 page가 page fault가 발생하여 오래전에 참조되었던 3번 page가 swap out 된다.
가장 오래전에 참조되었던 page를 swap out하면서 반복

2.6 LFU (Least Frequently Used) Algorithm

LFU: 참조 횟수(reference count)가 가장 적은 페이지를 지움

✔️ 최저 참조 횟수인 page가 여럿 있는 경우

LFU 알고리즘 자체에서는 여러 page 중 임의로 선정한다
성능 향상을 위해 가장 오래 전에 참조된 page를 지우게 구현할 수도 있다

✔️ 장단점

LRU처럼 직전 참조 시점만 보는 것이 아니라 장기적인 시간 규모를 보기 때문에 page의 인기도를 좀 더 정확히 반영할 수 있음
참조 시점의 최근성을 반영하지 못함
LRU보다 구현이 복잡함

✔️ LRU와 LFU 알고리즘 예제

[가정]

page frame은 4칸이 존재함
5번 page를 page fault 발생시켜야 하는 상황

[예시]

1번 페이지가 가장 먼저 할당되었고 1번 페이지는 총 4번 참조되었다.
1번 페이지 이후 2번 페이지가 할당되었고 2번 페이지는 총 3번 참조되었다.
2번 페이지 이후 3번 페이지가 할당되었고 3번 페이지는 총 2번 참조되었다.
마지막으로 4번 페이지가 할당되고 4번 페이지는 총 1번 참조되었다.

[결과]

LRU : 가장 오래전에 참조된 1번 page를 삭제함
LFU : 가장 최근에 할당되었음에도 적게 참조된 4번 page를 삭제함

2.8 Paging System에서 LRU, LFU 가능한가?

운영체제가 Page fault가 발생한 page를 물리적 메모리에 replace 한다. 그런데 비어있는 frame이 없을 경우 해당하는 알고리즘에 맞게 frame을 쫓아내야 하는데 이미 메모리에 해당 page가 존재할 경우 OS의 지원이 아닌 하드웨어 지원으로 주소변환이 일어나기 때문에 page의 참조 시간이나 page의 참조 횟수를 알 수 있는 방법이 없다. 즉 가상메모리 환경의 Page Fault 기법에서는 LRU, LFU 알고리즘을 사용할 수가 없다.

2.9 Clock Algorithm

LRU의 근사(approximation) 알고리즘

✔️ Clock Algorithm

여러 명칭으로 불림
- Second cahnge alogorithm
- NUR (Not Used Recently) 또는 NRU ( Not Recently Used)
Reference bit을 사용해서 교체 대상 페이지 선정 (circular list)
reference bit가 0인 것을 찾을 때까지 포인터를 하나씩 앞으로 이동
포인터 이동하는 중에 참조되지 않은 reference bit 1은 모두 0으로 바꿈
Reference bit이 0인 것을 찾으면 그 페이지를 교체
한 바퀴 되돌아와서도(=second chance) 0이면 그때에는 replace 당함
자주 사용되는 페이지라면 second change가 올 때 1
Clock algorithm의 개선
- reference bit과 modified bit (dirty bit)을 함께 사용
- reference bit → 1 최근에 참조된 페이지
- modified bit(=dirty bit) → 1 최근에 변경된 페이지 (I/O를 동반하는 페이지)
  - 메모리에서 write가 발생할 때 1로 세팅
  - page fault를 발생시킬 때 modified bit가 0인 page들을 먼저 쫓아내면 disk I/O 수행시간이 적어지는 장점이 있음

🌟 이미 메모리에 할당된 페이지를 참조할 때 reference bit을 변경하는 것은 OS가 아니라 하드웨어의 역할이다. 운영체제는 비트를 주기적으로 검사하여 reference bit이 0인 page를 replace 하는 역할을 한다.

3. Page Frame의 Allocation

💡 Allocation problem: 각 process에 얼마만큼의 page frame을 할당할 것인가?

✔️ Allocation의 필요성

메모리 참조 명령어 수행시 명령어, 데이터 등 여러 페이지 동시 참조
- 명령어 수행을 위해 최소한 할당되어야 하는 frame의 수가 있음
Loop를 구성하는 page들은 한꺼번에 allocate 되는 것이 유리함
- 최소한의 allcation이 없으면 매 loop 마다 page fault

✔️ Allocation Scheme

Equal allocation: 모든 프로세스에 똑같은 갯수 할당
Proportional allocation: 프로세스 크기에 비례하여 할당
Priority allocation: 프로세스의 priority에 따라서 다르게 할당

4. Global vs Local Replacement

✔️ Global replacement

Replace 시 다른 process에 할당된 frame을 빼앗아 올 수 있다
Process별 할당량을 조절하는 또 다른 방법
FIFO, LRU, LFU 등의 알고리즘을 global repacement로 사용시에 해당한다
Working set, PFF 알고리즘 사용

✔️ Local Replacement

자신에게 할당된 frame 내에서만 replacement
FIFO, LRU, LFU 등의 알고리즘을 process 별로 운영시

5. 다양한 캐싱 환경

✔️ 캐싱 기법

한정된 빠른 공간(=캐쉬)에 요청된 데이터를 저장해 두었다가 후속 요청시 캐쉬로부터 직접 서비스하는 방식
paging system 외에도 cache memory, buffer caching, Web caching 등 다양한 분야에서 사용됨

✔️ 캐쉬 운영의 시간 제약

교체 알고리즘에서 삭제할 항목을 결정하는 일에 지나치게 많은 시간이 걸리는 경우 실제 시스템에서 사용할 수 없음
Buffer caching이나 Web caching의 경우
- O(1)에서 O(log n) 정도까지 허용
Paging system인 경우
- page fault인 경우에만 OS가 관여함
- 페이지가 이미 메모리에 존재하는 경우 참조시각 등의 정보를 OS가 알 수 없음
- O(1)인 LRU의 list 조작조차 불가능

6. Thrashing

프로세스의 원활한 수행에 필요한 최소한의 page frame 수를 할당 받지 못한 경우 발생하는 현상

Page fault rate이 매우 높아짐
CPU utillization이 매우 낮아짐
OS는 MPD(Multiprogramming degree)를 높여아 한다고 판단
또 다른 프로세스가 시스템에 추가됨 (higher MPD)
프로세스당 할당된 frame의 수가 더욱 감소
프로세스는 page의 swap in / swap out으로 매우 바쁨
대부분의 시간에는 CPU가 한가함
low throughput

✔️ 대충 살펴봐도 프로세스 성능이 상당히 저하될 수 있는 현상이다. 이를 예방하기 위한 방법이 없을까?

있다 ! 앞서 설명한 Working set, PFF(Page-Fault Frequency) Scheme가 Thrashing 문제를 해결하기 위한 알고리즘이다.

6.1 Working-Set Model

✔️ Locality of reference

프로세스는 특정 시간 동안 일정 장소만을 집중적으로 참조한다.
집중적으로 참조되는 해당 page들의 집합을 locality set이라 한다.

✔️ Working-set Model

Locality에 기반하여 프로세스가 일정 시간 동안 원활하게 수행되기 위해 한꺼번에 메모리에 올라와 있어야하는 page들의 집합을 Working Set 이라고 정의한다.
Working Set 모델에서는 process의 working set 전체가 메모리에 올라와 있어야 수행되고 그렇지 않을 경우 모든 frame을 반납한 후 swap out (suspend)
Thrashing을 방지함
Multiprogramming degree를 결정함

6.2 Working-Set Alogorithm

✔️ Working set 결정 방법

Working set window를 통해 알아낸다
window size가 델타 인 경우
- 시각 t 에서의 working set WS (t)
  - Time interval [델타] 사이에 참조된 서로 다른 페이지들의 집합
- Working set에 속한 page는 메모리에 유지, 속하지 않은 것은 버림 (즉, 참조된 후 델타 시간 동안 해당 page를 메모리에 유지한 후 버림)

6.3 PFF (Page-Fault Frequency) Scheme

Page-fault rate의 상한값과 하한값을 둔다
- Page fault rate이 상한값을 넘으면 frame을 더 할당한다
- Page fault rate이 하한값 이하이면 할당 frame 수를 줄인다.
빈 frame이 없으면 일부 프로세스를 swap out 한다

7. Page Size의 결정

Page size를 감소시키면
- 페이지 수 증가
- 페이지 테이블 크기 증가
- Internal fregmentation 감소
- Disk transfer의 효율성 감소
  - Seek/rotation vs transfer
- 필요한 정보만 메모리에 올라와 메모리 이용이 효율적
  - Locality의 활용 측면에서는 좋지 않음

✔️ 현재 Trend

Larger page size

Reference

이화여자대학교 반효경 교수님 운영체제 강의

[운영체제 스터디] 가상 메모리와 Page Fault

🗳️ Virtual Memory

1. Demand Paging

2. Page Fault

2.2 Empty Frame이 없는 경우

2.3 Optimal Algorithm

2.4 FIFO (First In First Out) Algorithm

2.5 LRU (Least Recently Used) Algorithm

2.6 LFU (Least Frequently Used) Algorithm

2.8 Paging System에서 LRU, LFU 가능한가?

2.9 Clock Algorithm

3. Page Frame의 Allocation

4. Global vs Local Replacement

5. 다양한 캐싱 환경

6. Thrashing

6.1 Working-Set Model

6.2 Working-Set Alogorithm

6.3 PFF (Page-Fault Frequency) Scheme

7. Page Size의 결정

Reference

Further Reading

[운영체제 스터디] 운영체제란 무엇인가?

[운영체제 스터디] 컴퓨터 구조와 컴퓨터 시스템 동작원리

[운영체제 스터디] 프로세스와 쓰레드