HTTP 완벽 가이드

kimddakki 2022. 7. 25. 19:00
1부 HTTP : 웹의 기초
1장 HTTP 개관

 - 전 세계의 웹 브라우저, 서버, 웹 에플리케이션은 모두 HTTP ( Hypertext Transfer Protocol )을 통해 대화한다.

   HTTP는 현대 인터넷의 공용어다.

이 장을 통해 알아 볼 것

1. 얼마나 많은 클라이언트와 서버가 통신하는지
2. 리소스 ( 웹 컨텐츠 )가 어디서 오는지
3. 웹 트랜잭션이 어떻게 동작하는지
4. HTTP 통신을 위해 사용하는 메시지의 형식
5. HTTP 기저의 TCP 네트워크 통신
6. 여러 종류의 HTTP 프로토콜
7. 인터넷 곳곳에 설치된 다양한 HTTP 구성 요소

 

1.1 HTTP : 인터넷의 멀티미디어 배달부

 - 수십억 개의 JPEG 이미지, HTML 페이지, 텍스트 파일, MPEG 동영상, WAV 은성 파일, 자바 애플릿 등 하루도 쉬지

   않고 인터넷을 항해한다.

 => HTTP는 전 세계의 웹 서버로부터 이 대량의 정보를 빠르고, 간편하고, 정확하게 사람들의 PC에 설치된 웹 브라우저로

      옮겨준다.

 - HTTP는 신뢰성 있는 데이터 전송 프로토콜을 사용하기에 데이터가 지구 반대편으로 오더라도 전송 중 손상되거나 

   꼬이지 않음을 보장한다.

 

1.2 웹 클라이언트와 서버

 - 웹 컨텐츠는 웹 서버에 존재한다. 

 => 웹 서버는 HTTP 프로토콜로 의사소통하기 때문에 보통 HTTP 서버라고 불린다.

웹 클라이언트 ( HTTP 요청 )
------------./index.html 이라는 문서를 가져와라-------->
<-----------여기 있다 HTTP 포맷으로 되어있고 길이는 3,150 길이다.
웹 서버 ( HTTP 응답 )

1. 클라이언트가 " www.oreilly.com/index.html  " 입력

2. 웹 브라우저는 HTTP 요청을 " www.oreilly.com  " 서버에 보냄

3. 서버는 요청 받은 객체 ( index.html )을 찾는다.

4. 찾았다면 타입, 길이등의 정보를 HTTP 응답에 실어 클라이언트에게 보낸다.

 

1.3 리소스

 - 웹 리소스는 웹 콘텐츠의 원천이다.

Ex ) 파일 시스템 ( 정적 파일 ) => HTML 파일, 텍스트 파일, MS 워드 파일, JPEG 이미지 파일, AVI 동영상 파일 ...

Ex ) 사용자가 누구인지, 어떤 정보를 요청했는지, 몇 시인지에 따라 생성하는 동적 컨텐츠

       => 카메라의 라이브 영상, 주식 거래, 부동산 데이터베이스 검색, 온라인 쇼핑몰에서 선물 구입

Ex ) 어떤 종류의 컨텐츠 소스도 리소스가 될 수 있다.

       => 회사의 스프레드시트 파일, 지역 공공 도서관의 서가 탐색 웹 게이트웨이, 인터넷 검색 엔진, 프린트 등등

 

1.3.1 미디어 타입

 - 인터넷은 수천 가지 데이터 타입을 다루기 때문에, HTTP는 웹에서 전송되는 객체 각각에 신중하게 MIME 타입이라는

   데이터 포맷 라벨을 붙인다.

 => HTTP 응답 Header 에서 자주 볼 수 있다.

※ MIME 타입 ( Multipurpose Internet Mail Extensions, 다목적 인터넷 메일 확장 )

 - 다른 전자 메일 시스템 사이에서 메시지가 오갈 때 겪는 문제점을 해결하기 위해 설계된 것

 - 이메일에서 워낙 잘 동작하여 HTTP에서도 라벨을 붙이기 위해 채택됨.

 

웹 브라우저는 서버로부터 객체를 돌려받을 때 다를 수 있는 객체인지 MIME 타입을 통해 확인한다.

Content-type : image/jpeg Content-length: 12984

MINE 타입은 사선 ( / )으로 구분된 주 타입과 부타입으로 이루어진 문자열 라벨이다.
HTML로 작성된 텍스트 문서는 htest/html 라벨이 붙는다.
plain ASCII 텍스트 문서는 text/plain 라벨이 붙는다.
JPEG 이미지는 image/jpeg가 붙는다.
GIF 이미지는 image/gif가 붙는다.
애플 퀵타임 통영상은 video/quicktime이 붙는다.

 

1.3.2 URI

※ URI ( uniform resource identifier 통합 자원 식별자 )

 - 웹 서버 리소스는 각자 이름을 갖고 있기 때문에, 클라이언트는 관심 있는 리소스를 지목할 수 있다.

 - URI는 인터넷 우편물 주소 같은 것으로, 정보 리소스를 고유하게 식별하고 위치를 지정할 수 있다.

http:/www.joes-hardware.com/specials/saw-blade.gif
 => 죠의 컴퓨터 가게 서버에 있는 GIF 형식의 톱날 그림 리소스
 
 http : http 프로토콜을 사용하라
 /www.joes-hardware.com : www.joes-hardware.com로 이동하라
 /saecials/saw-blade.gif : /specials/saw-blade.gif라 불리는 리소스를 가져와라​

 

1.3.3 URL

※ URL ( uniform resource locator, URL )

 - URL은 특정 서버의 한 리소스에 대한 구체적인 위치를 서술한다.

 => URL은 리소스가 정확히 어디에 있고 어떻게 접근할 수 있는지 분명히 알려준다.

URL

http://www.oreilly.com/index.html : 오라일리 출판사 홈페이지의 URL
http://www.yahoo.com/images/logo.gif : 야후 웹 사이트의 로고 URL
http://www.joes-hardware.com/inventory-check.cgi?item=12731 : 물품 #12731의 재고가 있는지 확인하는 프로그램에 대한 URL
ftp://joe:tools4u@ftp.joes-hardware.com/locking-plier.gif : 비밀번호로 보호되는 FTP를 통해 locking-pliers.gif이미지 파일에 접근하는 URL

 

 - URL의 첫 번째 부분은 스킴 ( Scheme )이라고 부르는데, 리소스에 접근하기 위해 사용되는 프로토콜을 의미한다.

   보통은 HTTP 프로토콜 ( http:// ) 이다.

 - 두 번째 부분은 서버의 인터넷 주소를 제공한다.

 - 마지막은 웹 서버의 리소스를 가리킨다.

 

1.3.4 URN

※ URN ( uniform resource name, URN )

 - URN은 콘텐츠를 이루는 한 리소스에 대해, 그 리소스의 위치에 영향을 받지 않는 유일무이한 이름 역할을 한다.

 => 이 위치 독립적인 URN은 리소스를 여기저기로 옮기더라도 문제 없이 동작한다.

      리소스가 그 이름을 변하지 않게 유지하는 한, 여러 종류의 네트워크 접속 프로토콜로 접근해도 문제 없다.

 

1.4 트랜잭션 transaction

 - HTTP 트랜잭션은 요청 명령 ( 클라이언트에서 서버로 보내는 ) 과 응답 결과 ( 서버가 클라이언트에게 돌려주는 )로 

   구성되어 있다.

 - 이 상호작용은 HTTP 메시지라고 불리는 정형화된 데이터 덩어리를 이용해 이루어진다.

클라이언트: HTTP 요청 메시지는 명령과 URI를 포함한다.
--------------GET /specials/saw-blade.gif HTTP/1.0 -->
--------------Host : www.joes-hardware.com----------->

<-------------HTTP/1.0 200 OK-------------------------
<-------------Content-type: image/gif-----------------
<-------------Content-length : 8572-------------------
www.joes-hardware.com : HTTP 응담 메시지는 트랜잭션의 결과를 포함한다.

 

1.4.1 메서드

 - HTTP는 HTTP 메서드라고 불리는 여러 가지 종류의 요청 명령을 지원한다.

 => 모든 HTTP 요청 메시지는 한 개의 메서드를 갖는다.

GET : 서버에서 클라이언트로 지정한 리소스를 보내라.
POST : 클라이언트 데이터를 서버 게이트웨이 애플리케이션으로 보내라.
PUT : 클라이언트에서 서버로 보낸 데이터를 지정한 이름의 리소스로 저장하라.
DELETE : 지정한 리소스를 서버에서 삭제해라
HEAD : 지정한 리소스에 대한 응답에서 HTTP 헤더 부분만 보내라

 

1.4.2 상태 코드

 - 모든 HTTP 응답 메시지는 상태 코드와 함께 반환된다.

 => 상태 코드는 클라이언트에게 요청이 성공했는지 아니면 추가 조치가 필요한지 알려주는 세 자리 숫자다.

200 : 좋다. 문서가 바르게 반환되었다.
300 : 다시 보내라. 다른 곳에 가서 리소스를 가져가라.
400 : 없음. 리소스를 찾을 수 없다.​

 - HTTP는 각 숫자 상태 코드에 텍스트로 된 " 사유 구절 ( reason phrase ) " 도 함께 보낸다.

Ex ) 200 ok / 200 Document attached / 200 Success / 200 All's cool, dude

 

1.4.3 웹 페이지는 여러 객체로 이루어질 수 있다.

 - 애플리케이션은 보통 하나의 작업을 수행하기 위해 여러 HTTP 트랜잭션을 수행한다.

Ex ) 웹 브라우저는 시각적으로 풍부한 웹페이지를 가져올 때 대량의 HTTP 트랜젝션을 수행한다.

       => HTTP 뼈대를 한 번의 트랜잭션으로 가져온뒤, 첨부된 이미지, 그래픽 조각, 자바 애플릿 등을 가져오기 위한 HTTP

            트랜잭션들을 수행한다. 이 리소스들은 다른 서버에 위치할 수가 있다.

=> 웹 페이지는 보통 하나의 리소스가 아닌 리소스의 모음이다.

 

1.5 메시지

 - HTTP 메시지는 단순한 줄 단위의 문자열이다. 이진 형식이 아니기에 사람이 읽고 쓰기가 쉽다.

요청 메시지
GET / test/hi-there.txt HTTP/1.0
-- 시작줄
Accept: text/*
Accept-Language: en.fr
-- 헤더

응답 메시지
HTTP/1.0 200 OK
-- 시작줄
Content-type : text/plain
Content-length: 19
-- 헤더
Hi I'm a message!
-- 본문

시작줄 : 메시지의 첫 시작줄로 요청이라면 무엇을 하고 응답이라면 무슨 일이 일어났는지 나타난다.
헤더 : 0개 이상의 헤더 필드가 이어지는데 쉬운 구문 분석을 위해 콜론 ( : )을 기준으로 키 벨류를 이룬다.
본문 : 웹 서버로 데이터를 실어 보내거나 클라이언트로 데이터를 반환한다.
 => 문자열이며 구조적인 시작줄과 헤더와 달리 본문은 이진 데이터를 포함할 수 있다.!!

 

1.6 TCP 커넥션
1.6.1 TCP/IP

 - HTTP는 애플리케이션 계층 프로토콜이다.

 => 네트워크 통신의 핵심적인 세부사항에 대해서 신경쓰지 않는다!!

 

※ TCP

 - 오류없는 데이터 전송

 - 순서에 맞는 전달 ( 데이터는 언제나 보낸 순서대로 도착 한다. )

 - 조각나지 않는 데이터 스트림 ( 언제든 어떤 크기로든 보낼 수 있다. )

 

 - TCP/ IP는 TCP 와 IP가 층을 이루는, 패킷 교환 네트워크 프로토콜의 집합이다.

 - TCP/ IP는 각 네트워크와 하드웨어의 특성을 숨기고, 어떤 종류와 컴퓨터나 네트워크든 서로 신뢰성 있는 의사소통이

   가능하게 해준다.

 - 일단 TCP 커넥션이 맺어지면, 클라이언트와 서버 컴퓨터 간에 교환되는 메시지가 없어지거나, 손상되거나, 순서가 

   뒤바뀌는 일은 결코 없다.

 

 - 네트워크 개념상 HTTP는 TCP 위의 계층이다. HTTP는 자신의 메시지 데이터를 전송하기 위해 TCP를 사용한다.

HTTP : 애플리케이션 계층
TCP : 전송 계층
IP : 네트워크 계층
네트워크를 위한 링크 인터페이스 : 데이터 링크 계층
물리적인 네트워크 하드웨어 : 물리 계층

 

접속 IP 주소 그리고 포트 번호

 - HTTP 클라이언트가 서버에 메시지를 전송하기 전에 인터넷 프로토콜 주소와 포트번호를 사용해 TCP/IP 커넥션을

   맺어야 한다.

 

 - TCP 에서는 서버 컴퓨터에 대한 IP 주소와 그 서버에서 실행 중인 프로그램이 사용 중인 포트번호가 필요하다.

Case 1 ) http://207.83.29:80/index.html : IP 주소 ' 207.200.83.29 포트번호 : 80

Case 2 ) http://www.netscape.com:80/index.html : 도메인 이름 ( 호스트 명 ) www.netscape.com  포트 번호 : 80

 - 호스트 명은 IP 주소에 대한 이해하기 쉬운 형태의 별명이다. 호스트 명은 DNS ( Domain Name Service )를 통해 쉽게 IP

   변환이 가능하다.

Case 3 ) http://www.netscape.com/index.htrml : 포트 번호가 비면 기본값 80!

 

1. 웹 브라우저는 서버의 URL에서 호스트 명을 추출한다.
2. 웹 브라우저는 서버의 호스트 명을 IP로 변환한다.
3. 웹 브라우저는 URL에서 포트번호 ( 있다면 )을 추출한다.
4. 웹 브라우저는 웹 서버와 TCP 커넥션을 맺는다.
5. 웹 브라우저는 서버에 HTTP 요청을 보낸다.
6. 서버는 웹 브라우저에 HTTP 응답을 돌려준다.
7. 커넥션이 닫히면, 웹 브라우저는 문서를 보여준다.

 

1.7 프로토콜 버전 

HTTP/1.1

 - HTTP/1.1은 HTTP 설계의 구조적 결함 교정, 두드러진 성능 최적화, 잘못된 기능 제거에 집중했다.

 - HTTP/1.1은 더 복잡해진 웹 애플리케이션과 배포를 지원한다.

 - HTTP/1.1은 현재의 HTTP 버전이다!

 

 HTTP/2.0

 - HTTP/2.0은 HTTP/1.1 성능 문제를 개선하기 위해 구글의 SPDY 프로토콜을 기반으로 설계가 진행중인 프로토콜이다.

 

1.8 웹의 구성요소

 - 이 장에서, 웹 애플리케이션 ( 웹 브라우저와 웹 서버 )이 기본적인 트랜잭션을 구현하기 위해 어떻게 메시지를 주고 받는

   지에 대해 중점을 두었다.

 - 인터넷과 상호작용할 수 있는 웹 어플리케이션은 많다.

 

1. 프락시

 - 클라이언트와 서버 사이에 위치한 HTTP 중계자

 

2. 캐시

 - 많이 찾는 웹 페이지를 클라이언트 가까이에 보관하는 HTTP 창고

 

3. 게이트웨이

 - 다른 애플리케이션과 연결된 특별한 웹서버

 

4. 터널 

 - 단순히 HTTP 통신을 전달하기만 하는 특별한 프락시

 

5. 에이전트

 - 자동화된 HTTP 요청을 만드는 준 지능적 ( semi-intelligent ) 웹 클라이언트

 

1.8.1 프락시 서버

 - 프락시는 클라이언트와 서버 사이에 위치하여, 클라이언트의 모든 HTTP 요청을 받아 서버에 전달한다.

   ( 대개 요청을 수정 한 뒤 )

 - 이 애플리케이션은 사용자를 위한 프락시로 동작하며 사용자를 대신해 서버에 접근한다.

 

 - 프락시는 주로 보안을 위해 사용된다. 즉, 모든 웹 트래픽 흐름 속에서 신뢰할 만한 중개자 역할을 한다.

 => 요청과 응답을 필터링 하기도 함.!

Ex ) 회사에서 무언가를 다운 받을 때 애플리케이션 바이러스를 검출 

       초등학생에게서 성인 콘텐츠 차단.

 

1.8.2 캐시

 - 웹 캐시와 캐시 프락시는 자신을 거쳐가는 문서들 중 자주 찾는 것의 사본을 저장해두는 특별한 종류의 HTTP 프락시

   서버다.

 - 클라이언트는 멀리 떨어진 웹 서버보다 근처의 캐시에서 훨씬 더 빨리 문서를 다운 받을 수 있다.

 

1.8.3 게이트웨이

 - 게이트웨이는 다른 서버들의 중개자로 동작하는 특별한 서버다.

 - 게이트웨이는 HTTP 트래픽을 다른 프로토콜로 변환하기 위해 사용된다.

 

Ex ) HTTP/ FTP 게이트웨이는 FTP URI에 대한 HTTP 요청을 받아 들인 뒤, FTP 프로토콜을 이용해 문서를 가져온다.

      => 받아온 문서는 HTTP 메시지에 담겨 클라이언트에게 보낸다.

HTTP 클라이언트 < - HTTP - > HTTP/ FTP 게이트웨이 < - FTP - > FTP 서버

 

1.8.4 터널

 - 터널은 두 커넥션 사이에서 날 ( raw ) 데이터를 열어보지 않고 그대로 전달해주는 HTTP 애플리케이션이다.

 => HTTP 터널은 주로 비 HTTP 테이터를 하나 이상의 HTTP 연결을 통해 그대로 전송해주기 위해 사용된다.

EX)
암호화된 SSL 트래픽을 HTTP 커넥션으로 전송함으로써 웹 트래픽만 허용하는 사내 방화벽을 통과시키는 것이 있다.

클라이언트 -> SSL                         SSL -> SSL 커넥션 -> SSL -> 443포트 서버
              | 터널 시작                  |터널 끝 80번 포트
              HTTP SSL -> HTTP 커넥션 -> HTTP SSL

 

1.8.5 에이전트

 - 사용자 에이전트는 사용자를 위해 HTTP 요청을 만들어주는 클라이언트 프로그램이다.

 => 웹 요청을 만드는 애플리케이션은 뭐든 HTTP 에이전트이다. 지금까지는 한 가지 종류의 HTTP 에이전트, 웹 브라우저

      에 대해서만 이야기 했다.

 

 - 그 외

Ex ) 사람의 통제 없이 스스로 웹을 돌아다니며 HTTP 트랜잭션을 일으키고 콘텐츠를 받아오는 자동화된 사용자 에이전트!

       웹 로봇..

 


 

 

HTTP 완벽 가이드 : 네이버 도서

네이버 도서 상세정보를 제공합니다.

search.shopping.naver.com