파일 관련 용어 정리

UTF-8

유니코드를 표시하는 인코딩 방법 중 하나

  • 1~4 바이트 가변 인코딩 방식
  • 아스키에 경우 1바이트로 그대로 인코딩 다른 언어는 2, 3 바이트로 인코딩 하는 방식

Stream

파일이 이어지는 데이터들의 집합

  • 파일 입출력을 할때 모든걸 한번에 다운로드 받을 수는 없으니 이것을 나눠서 읽어야 하는데 이때 단위 흐름을 Stream 이라고 함

바이너리

  • 영상, 음원들이 저장되는 텍스트
  • 0101 이런 이진 형태
  • 이미지, 음원 등이 가진 바이너리의 규칙을 파악하여 이게 음악인지 이미지인지 파악하기도 함
00000 26 50 44 46 2D 31 2E 3G 
  • 보통 바이너리 뷰어에선 이런식으로 2진수를 16 진수로 변환하여 보여준다

Base64

  • 이런 바이너리 형태를 보여주는 텍스트 규칙
  • 보통 텍스트 에디터에서는 바이너리를 이런 형태로 표시해준다
����K������A��H�
  • Base64를 지원 하지 않는경우 그걸 UTF-8 이런 걸로 변환해서 보여주기도 함