압축 파일의 이해

2009. 1. 29. 15:37
*파일압축의 원리

파일에 저장되어 있는 정보를 압축하여 보다 적은 기억 공간에 동일한 정보를 저장하는 기술입니다. 일반적으로 정보에 포함되어 있는 중복된 내용을 삭제하거나 보다 적은 길이의 코드를 사용하여 정보를 표현하는 방법을 사용하여 저장에 필요한 공간의 크기를 줄입니다. 이런 과정을 압축이라고 하며, 압축된 정보를 사용하기 위해서 다시 원래의 상태로 복원하는 과정을 압축해제라고 합니다.

압축 방법에는 손실이 없는 압축 방법과 손실이 있는 압축 방법이 있습니다.

먼저 프로그램과 데이터 등과 같은 정보는 반드시 손실이 없는 압축 방법을 사용하여야 합니다. 손실이 없는 압축 방법이라고 하는 것은 압축된 정보를 다시 복원한 경우에 압축되기 이전의 상태와 동일한 내용과 크기를 가지게 되는 압축 방법을 말합니다.

하지만 이미지나 음성 등과 같은 경우에는 손실이 있는 압축 방법을 사용할 수 있습니다. 이미지나 음성에는 방대한 양의 정보가 존재하고 이들 정보 중에 일부가 사라진다 하더라도 사람이 눈이나 귀로 그 차이를 구별할 수 없기 때문입니다. 손실이 있는 압축 방법이라고 하는 것은 압축된 정보를 다시 복원하더라도 압축되기 이전의 상태 혹은 크기와 동일하지 않은 내용을 가질 수 있는 압축 방법을 뜻합니다.

*알집파일의 확장자 종류
.alz
이스트소프트에서 개발한 압축 형식입니다.. 분할 압축을 할 경우 확장자는 (ALZip 으로 생성) alz, a00, a01...형식으로 생성됩니다.

.ace
ACE, WinAce에서 이용하는 압축 형식입니다. 분할 압축을 할 경우 확장자는 ace, c00, c01, ... 형식으로 생성됩니다.

.arc
DOS용 프로그램 pkarc.com, pkxarc.com 에서 사용되는 압축 형식입니다.

.arj
DOS용 프로그램 arj.exe, 윈도우용 프로그램 WinArj에서 이용하는 압축형식입니다. 분할 압축을 할 경우 확장자는 arj, a01, a02,... 형식으로 생기게 됩니다.

.b64
인터넷에서 문서를 주고 받을때 사용하는 형식으로 BASE64MIME 형식으로 인코딩된 파일입니다.

.bh
BlackHole Format.

.bh
BinHex Format. E-Mail 로 이진(binary)형태의 파일을 보내기 위해 사용하는 형식입니다.

.bhx
인터넷에서 문서를 주고 받을때 사용하는 형식으로 BASE64MIME 형식으로 인코딩된 파일입니다.

.bz2
UNIX용의 bzip2 에서 사용하는 압축 형식 입니다. 파일 하나만 압축 할 수 있으므로 주로 .tar와 함께 사용되며 이 경우 .tar.bz2 의 확장자를 갖습니다. (bzip2 로 생성)

.cab
Microsoft Cabinet 파일. 마이크로소프트에서 사용하는 압축 형식입니다.

.ear
내부적으로 zip 압축 알고리즘을 사용하는 파일 형식입니다.

.enc
E-Mail 로 이진(binary)형태의 파일을 보내기 위해 사용하는 형식입니다.

.gz
UNIX용의 gzip에 에서 사용하는 압축 형식 입니다. 파일 하나만 압축 할 수 있으므로 주로 .tar와 함께 사용되며 이 경우 .tar.gz 의 확장자를 갖고 줄여서 .tgz확장자를 사용하기도 합니다.

.ha
PPMC를 개선한 압축 파일 형식입니다.

.hqx
맥에서 제작된 파일을 인터넷에서 문서를 주고 받을때 사용하는 형식입니다. (BinHex로 생성)

.ice
DOS용 프로그램 ice.exe 에서 사용하는 압축 형식입니다. 실제 파일 내용은 lha와 동일합니다.

.jar
자바의 jar.exe 에서 사용하는 압축 형식입니다. 내부적으로 zip 압축 알고리즘을 사용합니다.


.lha, lzh
DOS용 프로그램 lha.exe, lharc.exe에서 사용하던 압축 형식입니다. Lempel-Ziv 알고리즘을 사용합니다.

.mim
인터넷에서 문서를 주고 받을때 사용하는 형식입니다.

.pak
DOS용 프로그램 pak.exe에서 사용하던 압축 형식입니다.

.rar
DOS용 프로그램 rar.exe와 윈도우용 프로그램 winrar.exe에서 사용하는 압축 형식입니다. 분할 압축을 할 경우 확장자는 rar, r00, r01,... 형식으로 생기게 됩니다.

.tar
UNIX 명령 tar를 이용해 생성되는 파일 형식으로 실제로는 압축은 되지 않고 여러 파일을 하나로 묶어주기만 합니다. 보통 tar로 묶은 후 gz으로 압축하며 이 경우 .tar.gz 의 확장자를 갖고 줄여서 .tgz확장자를 사용하기도 합니다.

.tgz
UNIX 에서 tar로 묶은 파일을 gzip으로 압축한 파일 형식입니다.

.uue
UU Encoded Format. E-Mail 로 이진(binary)형태의 파일을 보내기 위해 사용하는 형식입니다.

.war
내부적으로 zip압축 알고리즘을 사용하는 파일 형식입니다.


.xxe
XXEncode Format. E-Mail 로 이진(binary)형태의 파일을 보내기 위해 사용하는 형식입니다.

.z
UNIX용의 compress, uncompress에서 사용하는 파일 형식입니다.

.zip
도스용 프로그램 pkzip.exe, pkunzip.exe에서 사용하는 파일 형식입니다. 알집에서는 zip 형식을 default로 지원하고 있습니다.

.zoo
DOS용 프로그램 zoo.exe 에서 사용되는 파일 형식입니다.

.001
rzjoin 으로 분할된 파일 형식입니다. 압축이 아닌 단순히 001, 002...... 순서로만 분할된 파일입니다.

※ 출처 : http://kin.naver.com/detail/detail.php?d1id=1&dir_id=10504&eid=O0/dFg0HdBQV+2B13iW6VSszWGDuugW2&qb=d2FyIL7Qw+A=&pid=fhaL8loi5TNsst1Diqhsss--017383&sid=SYFJPUVGgUkAAE@REuw
Posted by n3015m
:
BLOG main image
'네오이즘'의 보안LAB 블로그입니다........... n3oism@gmail.com by n3015m

카테고리

분류 전체보기 (228)
[ HappyDevTool ] (29)
[ HappyToolRelease ] (4)
[Book] (6)
[ Security Studies ] (0)
- CII (2)
- BigData (2)
- Web Hacking (10)
- SQL Injection (25)
- Mobile Security (9)
- Network (6)
- OperatingSystem (4)
- Malware & Reversing (4)
- Phishing (5)
- Compliance (0)
- Programming (13)
- Tools (13)
- IoT (6)
- etc (21)
[Pentration Testing] (3)
[OS X] (4)
[ Security Trends ] (16)
[ Fixing Guideline ] (7)
My Way, My Life (34)
About Me (2)

최근에 올라온 글

최근에 달린 댓글

최근에 받은 트랙백

Total :
Today : Yesterday :