Floating Point, 부동소수점의 표현

Update: 2023.03.26 Updated: 2022.03.26

저번 챕터에서 floating point는 표현하는 방식이 달라서 일반 정수와 다른 hexadecimal notation으로 표기되는 것을 확인할 수 있었는데, 이번 챕터에서는 이 실수가 표기되는 정확한 방식과 원리에 대해 다루고 있다.

실수를 일반적인 이진법으로 접근하면, binary point를 기준으로 두 영역으로 나눌 수 있다.

그리고 이를 수식화하면 : $\sum_{k = -j}^ib_k*2^k$

하지만 이와 같은 방식으로 실수를 표기하면 몇 가지 문제점이 발생한다.

$x/2^k$ 형태로 나타낼 수 있는 경우만 표현 가능

ex. $1/3 = 0.01010101..$ : 무한 소수가 되는 경우 표현할 수 없음
표현할 수 있는 실수의 범위가 매우 한정적 (8 bit fixed point)

따라서 이러한 수에 대한 문제점들을 보완하고자 도입된 실수 표현법이 IEEE 표준안이다.

IEEE 754 표준안은 현재 가장 널리 대표적으로 사용되는 소숫점 표기법으로, 실수 전체의 비트를 크게 3부분으로 나누어서 표기한다.

Sign bit (S) : negative(-)인지 positive(+)인지 판별
Exponent (E = Exp-Bias)
- Biased Exp : 2의 지수 부분에 해당
- Bias : $2^{(k-1)} - 1$, ( $k$ : exponent bit)
Mantissa (M) : 숫자의 body 부분 담당, $[1.0, 2.0)$ 사이의 수를 가진다.

그리고 위의 구조를 수식화하면 : $(-1)^SM2^{E}$

이러한 표현 방식의 장점은 exponent의 개념을 도입함으로써

Precision options

표현하는 숫자의 정밀도에 따라 다음과 같이 구분할 수 있다.

다음과 같이 주어졌을 때, IEEE 표준 방식을 사용해서 실수로 나타내본다고 하면,

각각 sign은 $S$, exponent는 $exp$, Mantissa는 $M$에 해당하는 값을 의미한다.

수식을 적용해서 풀면 해당 실수는 ${137/8}_{(10)}$의 값을 가지게 된다.

반대로 $17.125_{(2)}$를 IEEE 형식을 사용해서 이진 실수로 나타내보면,

다음과 같이 잘 변환되는 것을 확인할 수 있다.

Normalized Values : $exp ≠ 000..00$ and $exp ≠ 111..11$ 가 아닌 모든 경우

-> 위에 설명한 수식 그대로 $E = Exp - Bias$를 적용해서 계산한다.
Denormalized Values : Normalized가 아닌 경우

-> 예외 케이스로 간주해서 exponent를 다르게 계산한다.

@Computer Systems a programmer’s perspective third edition 내용을 참고함