Machine-level 프로그래밍 : Basic Assembly

Update: 2023.04.12 Updated: 2022.04.12

Category: Computer Systems

Tags: assembly compiler processor register

History of Intel processors and architectures

Intel x86 Processors

이 강의는 Intel 프로세서를 중심으로 설명하지만, 최근에는 Arm 프로세서로 추세가 바뀌어 가고 있다.

Intel (CISC - Complex Instruction Set Computer)

: 세계 최초의 마이크로프로세서 개발(1978), 오랜 기간 동안 독보적인 위치를 차지

8086 (16 bit) -> IA32 (32bit) -> x86-64 (64 bit) -> (more cores!)

-> RISC에게 밀린 이유 : 많은 instruction마다 다른 logic gate 형태로 저장하고 있기 때문에 많은 에너지가 소모됨. 하지만 요새 메인 이슈는 sustainable developement, 따라서 에너지를 절약하는 RISC에 밀리게 됨.
Arm (RISC - Reduced Instruction Set Computer)

: 영국 기업 Arm Holdings가 디자인한 마이크로 프로세서 아키텍쳐

-> 이후 애플은 이 아키텍쳐를 구매해서 자체 칩(M1 chip)을 만들어 사용하고 있고, 최근 들어 삼성도 Arm 기술을 사용해서 자체 프로세서를 제작하고 적용 중에 있음.

C, assembly, machine code

Machine Code : 프로세서가 실행하는 byte-level 기계어 코드

Assembly Code : 0과 1로 이루어진 기계어를 텍스트로 보완한 코드

-> 어셈블리어는 하이레벨 코드와 기계어의 중간 단계라고 보면 된다!

Turning C into Object Code

작성된 파일이 머신 레벨 코드로 컴파일되는 전체적인 과정 :

C 파일(test.c) -> 어셈블리 파일(test.s) -> 오브젝트 파일(test.o) -> 실행 파일(a.out)

ex. 로컬 터미널에서 한 단계씩 컴파일한 결과

test.c / test.s / test.o / a.out / objdump(-> disassembler)

Compiling Into Assembly

gcc -Og -S sum.c -> sum.s 파일 생성

-S : 어셈블하는 단계에서 컴파일 과정을 stop하고 반환하라는 의미.
-Og : 코드를 최적화시켜주는 optimization flag. -> 없으면 코드가 매우 복잡해서 읽기 어려움.

확인할 수 있는 instruction set : pushq, movq, call, popq, ret 등

여기서 보면 명령어 뒤에 알파벳(q)가 붙어있는 것을 확인할 수 있는데, 현재 레지스터가 처리하는 데이터의 크기에 따라 정해진다.
- b = byte (8 bit)
- w = word (16 bit)
- l = long (32 bit integer, 64-bit floating point)
- q = quad (64 bit) - 주로 많이 사용!
-> 현재 많은 컴퓨터 시스템에서 64 비트 아키텍쳐(데이터 타입)를 사용하기 때문

터미널에서 C 코드를 어셈블리 파일로 변환한 내용은 다음과 같다.

-> 앞에 .로 시작하는 라인은 CPU가 실행하는 명령어에 속하지 않고, 어셈블러와 링커 그리고 디버거에게 부가 정보를 전달하는 역할. 나중에 실행파일 만들 때 없어진다.

Disassembling Object Code

objdump -d sumstore.o -> disassemble 결과를 띄워준다

기존 assemble 단계에서는 어셈블리 파일을 오브젝트 파일로 변환해준다면, 여기서는 반대로 오브젝트 파일을 다시 어셈블리 파일로 변환하는 것.

터미널에서 objdump를 출력한 결과

Disassembler를 사용하는 이유

오브젝트와 어셈블리 코드를 같이 보여줘서 명령어별로 코드를 확인하기 쉬움
생성된 실행 파일을 디버깅하거나 분석하는데 용이

하지만 이렇게 실행 파일을 거꾸로 분석하는 reverse engineering은 위험하다!

해당 파일에 license가 있는지 확인하고, 있을 경우 copyright 이슈를 조심해야 한다.

Assembly Basics: Registers, operands, move

x86-64 Integer Registers

레지스터는 일반 목적(흰색)과 특수 목적(빨간색)으로 사용되는 레지스터로 나눌 수 있다.

일반 목적(general-purpose)의 레지스터는 데이터를 저장하거나, 메모리 주소를 가지고 있거나, 산술 연산을 수행한다. 반면에 특수 목적(special purpose)의 레지스터는 %rip(instruction pointer)나 %rsp(stack pointer) 등 주로 다른 특정 기능을 수행할 때 사용된다.

Moving Data : movq

movq $Source, Dest$

movq 명령어는 소스 데이터(source)를 특정 목적지(destination)로 이동(복사)하는 명령어

처리하는 데이터의 크기, 즉 레지스터의 크기에 따라서 move 명령어 뒤에 다른 접미사 수식이 붙는데, movq는 64bit operation을 사용하는 경우 해당된다.

. movabsq : source는 항상 immediate, destination은 항상 register만 가능

Operand Combination

Immediate : 상수로 된 정수 데이터

ex. $0x400, $-533 ($ : 일시적인 값이라는 의미)
Register : 16가지의 정수 레지스터 중 하나

ex. %rax, %r13 등
Memory : 연속적인 8byte 메모리 주소

ex. (%rax) (괄호 안은 메모리 주소를 저장하고 있다는 의미)

-> memory-memory로는 이동할 수 없다.
따라서 메모리-> 레지스터, 또는 레지스터-> 메모리로 나누어 이동해야 한다.

ex. movb, movw, movl, movq로 값이 바뀌는 과정

먼저 moveabsq로 레지스터의 값을 초기화한다. 그리고 뒤에 movb, movw, movl, movq를 사용해서 레지스터의 값을 바꾸는 과정으로 나타낸다.

-> 여기서 $-1(FF)$ 이렇게 각 byte수의 2배로 값이 들어가는 이유는 hexadecimal notation에 따라 4개의 bit씩 끊어서 변환되기 때문이다.

기존 move 명령어는 source와 destination의 operand 사이즈를 맞추어 주어야 한다는 한계점이 있다. 그래서 이를 극복하기 위해서 남은 비트를 확장해서 채우는 매커니즘을 도입한 명령어가 다음과 같다.

movz (zero extension) : 남은 destination bit를 $0$으로 채운다
movs (sign extension) : 남은 destination bit를 sign bit으로 채운다

-> 단, destination operand의 크기가 더 커야한다는 전제가 필요하다!

Simple Memory Addressing Modes

데이터가 저장되는 장소를 memory로 한정 짓지 않고, 레지스터까지 넓게 보아서 레지스터내에 있는 데이터를 가르키는 방법까지 addressing mode라고 표현하고 있다.

Normal : $(R)$ $= Mem[Reg[R]]$

movq (%rcx), %rax : rcx에 저장된 (메모리 주소)에 있는 데이터를 rax로 옮김
Displacement : $D(R)$ $= Mem[Reg[R]+D]$

movq 8(%rbp), %rdx : rbp에 저장된 (메모리 주소+8)에 있는 데이터를 rdx로 옮김

-> displacement는 일종의 메모리 주소를 jump 시키는 방법으로 생각하면 됨!

Complete Memory Addressing Modes

가장 일반적인 addressing 형식 :

$D(Rb, Ri, S)$ $= Mem[Reg[Rb] + S * Reg[Ri] + D]$

$D$ : displacement 이동시키는 상수
$Rb$ : base 레지스터 (16개의 정수 레지스터)
$Ri$ : index 레지스터 (%rsp를 제외한 레지스터)

ex 1. 메모리 address 계산 문제

ex 2. 다음 코드에서 아래와 같이 element를 메모리 주소에 저장

Arithmetic & logical operations

Address Computation : leaq

leaq $Source, Dest$

Source : memory operand (address mode operation 계산)

Dest : destination register (항상 register에 저장)

lea는 load effective address의 줄임말로, 메모리 참조 없이 주소만을 가져와서 계산하고, 그 결과를 레지스터에 저장한다. 크게 두 가지 목적으로 수행한다. :

& operation : p = &x[i]

주소 값을 가져와서/계산해서 저장
arithmetic operation : x*12 (shift + add)

곱하기 연산을 shift + add 연산으로 최적화

ex. 예시는 다음과 같다.

여기서 12 = 3 * 4 형태로 바꾸어서 계산하면 shift+add로 나타낼 수 있다.
```
 leaq (%rdi, %rdi, 2), %rax  # x*3
 salq $2, %rax   # (x*3) * 4 = x*12
```
일반적인 곱하기 연산은 많은 logical gate를 필요로 하기 때문에 이렇게 add와 shift연산으로 바꾸어서 수행할 경우, 훨씬 효과적으로 계산할 수 있다.

위와 같은 과정은 최적화의 일부에 해당되고, 컴파일 과정에서 자동으로 처리된다.

movq vs. leaq

다음과 같이 각각의 명령어에 같은 instruction을 준다고 할 때,

movq (%rdi, %rdi, 2), %rax   # 3*rdi 주소가 가르키는 **value 저장** 
leaq (%rdi, %rdi, 2), %rax   # 3*rdi **주소값 저장** 

즉, movq는 데이터를 메모리에서 레지스터, 혹은 레지스터에서 메모리로 옮길 때 사용하고 leaq는 메모리 주소를 계산해서 레지스터에 저장할 때 사용한다.

Arithmetic Expression

operand가 2개인 연산

-> unsigned와 signed의 구분이 없다. bit-level에서 arithmetic operation이 이루어지기 때문에 같은 방식으로 계산
operand가 1개인 연산

더 자세한 부분들은 교과서를 참고하면 설명이 매우 잘 되어 있다.

@Computer Systems a programmer’s perspective third edition 내용을 참고함

맨 위로 이동하기

승빈 Binnie Shin