컴퓨터 공학/컴퓨터 구조

[혼공컴운] chapter.02 데이터

hhzinistic 2023. 7. 6. 14:57

이전글 - 2023.07.06 - [컴퓨터 공학/컴퓨터 구조] - [혼공컴운] chapter.01 컴퓨터 구조 시작하기

 

[혼공컴운] chapter.01 컴퓨터 구조 시작하기

01-1 컴퓨터 구조를 알아야 하는 이유 문제 해결 컴퓨터 구조를 이해하고 있다면 문제 상황 빠르게 이해, 문제 해결 가능성 ↑ 성능, 용량, 비용 - 어떤 CPU, 어떤 메모리를 사용할 지 직접 판단하고

zinistic.tistory.com

 

02-1 0과 1로 숫자를 표현하는 방법

  • 정보 단위
    - 비트(bit):0과 1을 나타내는 가장 작은 정보 단위 ( 이진법: 2의 1제곱 가지 표현 가능 / 십육진법: 16의 1제곱 가지 표현 가능)
    - 바이트(byte): 비트 8개를 묶은 단위 ( 이진법: 2의 8제곱 가지 표현 가능 / 십육진법: 16의 8제곱 가지 표현 가능)
1바이트(byte) 8비트(8bit)
1킬로바이트(1kB)
바이트
1메가바이트(1MB)
바이트
1기가바이트(1GB)
바이트
1테라바이트(1TB)
바이트

      - 워드(word): CPU가 한 번에 처리할 수 있는 데이터 크기


  • 이진법(binary): 0과 1으로 숫자를 표현하는 방법
    - 이진수: 이진법으로 표현한 수

    * 이진수의 음수 표현 ( 2의 보수 (two's complement) )
    1. n비트의 이진수를 각 비트마다 not 연산하기
    2. 그 이진수에 1 더하기

    → 2의 보수로 표현한 수의 음수 양수는 "플래그(plag)"로 구분한다.




  • 십육진법(hexadecimal): 15를 넘어가는 시점에 자리 올림. 0~9, A~F까지 사용.
    → 비트당 16가지 수 표현 가능




  • 십육진수 이진수 변환
    십육진수 →이진수 : 십육진수 한 자리수 당 이진수 4비트
    이진수 → 십육진수: 이진수 4비트씩 끊어 십육진수 한 자리



 


02-2 0과 1로 문자를 표현하는 방법

  • 문자 집합과 인코딩
    - 문자 집합: 컴퓨터가 인식하고 표현할 수 있는 문자의 모음
      ex) 아스키코드, 유니코드 등
    - 문자 인코딩: 문자를 이진수로 변환하는 과정
    - 문자 디코딩: 이진수를 문자로 변환하는 과정




  • 아스키 코드(ASCII): 2의 7제곱(128) 가지 문자 표현 가능
    ※ 한글 표기 불가능 문자 집합



  • EUC-KR: KS X 1001 와 KS X 1003 을 사용하는 8비트 문자 집합. EUC의 일종이며 대표적인 한글 완성형 인코딩
    <한글을 표현하는 인코딩 방법>
    - 완성형 인코딩: 완성된 하나의 글자에 고유한 코드 부여하는 인코딩 방식
    - 조합형 인코딩: 초성, 중성, 종성 각 비트열 할당하여 하나의 코드를 만드는 인코딩 방식



  • 유니코드와 UFT-8
    - 유니코드: 국제 표준 문자 집합 ( 여러 언어 표현 가능)
    -  UFT-8(Unicode Transformation Format - 8bit): 가변 길이 유니코드 인코딩 방식
    즉, 부여된 값의 범위에 따라서 1~4바이트로 표현 가능