본문 바로가기
Project/Backend 프로젝트

백엔드 프로젝트 3주차 (SQL 첫걸음) - 1장

by 주원주 2023. 9. 17.

데이터베이스와 SQL

 

🎯데이터베이스

데이터베이스: 데이터란 컴퓨터 안에 기록되어 있는 숫자를 의미하는데, 이러한 데이터의 집합을 데이터베이스라 함.

  • 넓은 의미: 컴퓨터 안에 기록된 모든 것
  • 일반적으로 통용되는 데이터베이스: 특정 데이터를 확인하고 싶을 때 간단하게 찾아낼 수 있도록 정리된 형태
  • 데이터 베이스 내의 데이터는 영구적으로 보존되어야 함
  • 주기억장치에만 데이터를 저장하면 영구적이지 못함, 따라서 데이터베이스의 데이터는 하드디스크나 플래시메모리(SSD) 등 비휘발성 저장장치에 저장함.

시스템 내의 데이터베이스

 

이전까지는 데이터베이스를 일반적으로 데이터센터의 서버에서 운용했으나, 현재는 데이터베이스가 개인용 컴퓨터나 휴대용 기기(전화번호 등)에 내장되어 있기도 함.

 

한편 데이터센터에 설치된 데이터베이스를 사용하는 시스템도 여전히 많으며, 인터넷에서 쇼핑을 하거나 예약을 할 때 웹 시스템을 통해 데이터베이스에 접근 가능함.

 

시스템을 직접 사용하지 않는 상황에서도 데이터베이스에 데이터가 전송되는 경우가 있음(예들 들어 편의점 계산대에서 데이터가 데이터베이스로 전송됨).

 

DB와 DBMS

 

DB: Database는 일반적으로 DB라는 말로 통용됨. 데이터베이스는 저장장치 내에 정리되어 저장된 데이터의 집합.

DBMS: 데이터베이스를 효율적으로 관리하는 소프트웨어를 '데이터베이스 관리 시스템(Database Management System', 약자로 DBMS이라고 부름.

 

DBMS와 같은 전용 소프트웨어가 필요한 이유

  • 생산성: 시스템 개발 과정에서의 생산성 향상 도모(데이터 검색, 추가, 삭제, 갱신과 같은 기본 기능 제공)
  • 기능성: 데이터베이스를 다루는 기능 제공(복수 유저 요청에 대응, 대용량의 데이터를 저장하고 고속으로 검색하는 기능, 데이터베이스 관리 기능은 유저가 확장 가능)
  • 신뢰성: 대규모 데이터베이스는 많은 요청에 대응할 수 있도록 만들어짐, 이를 위해 하드웨어를 여러 대로 구성하여 신뢰성을 높이는 동시에 성능 향상을 꾀함. 또한 다른 저장 장치로 내보내는 export과 데이터베이스 안에 데이터를 집어넣는 import 등의 기능을 갖추어 데이터베이스를 간단하게 백업할 수 있음

▶️DBMS란 데이터베이스를 관리하는 소프트웨어로, 사용 목적은 생산성 향상과 기능성, 신뢰성 확보에 있음

 

데이터베이스를 조작하는 언어 SQL

 

SQL: DBSM과의 대화에 필요하며, 데이터베이스의 종류 중 '관계형 데이터베이스 관리 시스템(RDBMS: Relational Database Management System)'을 조작할 때 사용함. SQL 명령의 종류는 다음과 같음

  • DML: Data Manipulation Language의 약자. 데이터베이스에 새롭게 데이터를 추가하거나 삭제하거나 내용을 갱신하는 등, 데이터를 조작할 때 사용함. SQL의 가장 기본이 되는 명령 세트(set). ▶️데이터 조작
  • DDL: Data Definition Language의 약자. 데이터를 정의하는 명령어. 데이터베이스는 '데이터베이스 객체(object)'를 이용하여 데이터를 관리하는데, 이 같은 객체를 만들거나 삭제하는 명령어. ▶️데이터 정의
  • DCL: Data Control Language의 약자. 데이터를 제어하는 명령어. 트랜잭션을 제어하는 명령과 데이터 접근권한을 제어하는 명령이 포함되어 있음. ▶️데이터베이스 제어

 

🎯다양한 데이터베이스

DBMS의 종류

  • 계층형 데이터베이스: 역사가 오래된 DBMS로, 폴더와 파일 등의 계층 구조로 데이터를 저장하는 방식의 데이터베이스. 하드디스크나 DVD 등이 있으며, 현재에는 채택되는 경우가 많지 않음.
  • 관계형 데이터베이스: '관계 대수(relational algebra)'라는 것에 착안하여 고안한 데이터베이스로, 행과 열을 가지는 표 형식 데이터를 저장하는 형태. 2차원 데이터로 가로 방향으로는 '열'을, 세로 방향으로는 '행'을 나열함. 각각의 표에 이름을 붙여 관리하며, 이때 데이터베이스 안의 데이터는 SQL 명령어로 조작할 수 있음.
  • 객체지향 데이터베이스: 가능하면 객체 그대로를 데이터베이스의 데이터로 저장하는 것
  • XML 데이터베이스: XML이란 자료 형식을 가리키는 용어로, 태그를 이용해 마크업 문서를 작성할 수 있게 정의한 것. 태그는 <data>데이터</data>와 같은 형식으로 표현하며, HTML과 유사함. XML 데이터베이스는 이처럼 XML 형식으로 기록된 데이터를 저장하는 데이터베이스임.
  • 키-밸류 스토어(KVS): 키와 그에 대응하는 값(value)이라는 단순한 형태의 데이터를 저장하는 데이터베이스. 열 지향 데이터베이스라고도 불림.

RDBMS는 비교적 오래된 축에 속하는 데이터베이스이긴 하지만, 변하가 빠른 시스템 업계에서 여전히 데이터베이스의 주류를 이룸. 또한 RDBMS 중 XML 형식의 데이터를 표에 넣거나, 자바나 C++의 겍체를 가능한 한 그대로 데이터로 넣을 수 있도록 확장한 데이터베이스 제품도 존재함.

 

RDBMS 사용 시스템

RDBMS는 역사가 깊은 만큼 다양한 시스템에서 사용됨.

  • 메인프레임(main frame, 대형 범용기기): 대부분 RDBMS를 사용. 기업의 기반 시스템으로 채택됨. 
  • 현재 일반적으로 사용하는 인터넷, 웹 시스템에서도 RDBMS 사용.
  • 하드웨어의 진화로 단말이 고성능화, 소형화되면서 지금은 휴대전화에도 RDBMS가 내장되어 있음.

데이터베이스 제품

RDBMS는 관계형 데이터베이스를 관리하는 소프트웨어를 일컫는 말이지, RDBMS라는 이름의 소프트웨어가 존재하는 것이 아님. 실제로 시중에 판매되거나 오픈소스로 자유롭게 다운로드할 수 있는 유명한 제품들은 다음과 같음.

  • Oracle: 가장 많이 쓰이는 RDBMS 중 하나, 사실상 표준이라고 해도 문제없음
  • DB2: IBM 컴퓨터에서만 구동 가능, 이후에도 시장 점유율 확대 X
  • SQL Server: 윈도우 플랫폼에서만 동작, 윈도우가 서버 분야로 영역을 넓히면서 SQL Server를 사용하는 시스템도 많이 증가함
  • PostgreSQL: 무료 소프트웨어인 만큼 자유롭게 사용 가능, 실험적인 기능이 포함되어 있거나 독특한 구조를 가짐
  • MySQL: 처음 나올 때는 경량 데이터베이스라는 점을 강조하여 필요한 최소한의 기능만 갖추었으나 현재까지 기능이 확장되면서 다른 RDBSM과 비교해도 부족하지 않을 정도.
  • SQLite: 임베디드 시스템에 자주 사용됨.

SQL의 방언과 표준화

모든 RDBMS는 SQL을 사용하나, 각 데이터베이스 제품별로 기능 확장이 이루어지는 과정에서 '비슷한 조작을 실행하더라도 서로 다른 명령어가 필요한' 상황 발생 >> 특정 데이터베이스 제품에만 통용되는 고유 방언이 생겨난 것

  • 키워드 생략
  • 외부결합(표준 SQL의 경우 'LEFT JOIN' 사용)

이러한 방언 문제를 해결하기 위해 표준 SQL을 사용. 지금까지 많은 RDBMS가 표준화에 동참하여 기능을 확장해온 덕에 현재는 방언이 많이 줄어들었음.

 

🎯데이터베이스 서버

많은 RDBMS가 클라이언트/서버 모델을 채택하여 가동 중인데, 특히 웹 시스템과 연동하는 RDBMS라면 접속자 수가 수백 명에 달하는 전용 데이터베이스 서버를 운용하는 일도 드물지 않음. 

 

클라이언트/서버 모델

 

RDBMS는 복수의 클라이언트가 보내오는 요청에 응답할 수 있도록 클라이언트/서버 모델로 동작함

  • 클라이언트: 서버에 접속 요청이나 SQL 명령 실행요청 보냄
  • 서버: 클라이언트의 명령을 처리하고 그 결과를 반환
  • 클라이언트/서버 모델: 복수의 컴퓨터 상에서 하나의 모델을 구현하는 시스템

웹 시스템: 브라우저와 웹 서버로 구성되는 클라이언트/서버 모델의 시스템(클라이언트-브라우저 / 서버-웹 서버)

1. 브라우저는 사용자가 지정한 URL과 연결된 웹 서버에 요청을 보내며, 이때 요구사항을 웹 용어로 '리퀘스트(request)'라고 부름. 요청의 예시로는 '이 페이지를 열람하고 싶다' 등이 있음.

2. 클라이언트의 요청을 받은 웹 서버에서는 그에 맞게 처리, 요청이 '이 페이지를 열람하고 싶다'이므로 서버는 브라우저가 페이지를 표시할 수 있도록 HTML로 된 데이터를 클라이언트로 반환함. 데이터는 네트워크를 통해 전송됨. 한편 서버의 응답은 웹 용어로 '리스폰스(response)'라고 함.

3. 페이지 내용을 전달받은 브라우저는 화면에 페이지 내용을 표시함.

 

RDBMS의 클라이언트/서버

1. 웹시스템과 달리 사용자 인증이 필요함(ID, 비밀번호). 만약 실패하면 데이터베이스에 접속할 수 없음

2. RDBMS에 접속하면 SQL 명령을 서버에 보낼 수 있음. 서버가 가동 중이고 네트워크에도 연결되어 있다면, 클라이언트에서 SQL 명령을 보낼 때 서버는 응답할 것. 한 번 데이터베이스에 접속하면, 이를 유지하여 재접속 없이 SQL 명령을 여러 번 보낼 수 있음.

3. 사용이 끝나면 데이터베이스와의 접속이 끊기며, 일반적으로 클라이언트를 종료하면 데이터베이스 접속도 끊김.

 

웹 애플리케이션의 구조

 

웹 시스템은 클라이언트/서버 모델로 구성되며 브라우저가 클라이언트, 아파치나 IIS와 같은 웹 소프트웨어가 서버 역할을 함. 클라이언트가 서버에게 요청하면 웹 서버는 클라이언트에게 응답함

 

웹사이트가 정적인 HTML만으로 구성되어 있다면 웹 서버만으로도 시스템을 구축할 수 있을 것. 하지만 웹 애플리케이션이라 부를 정도의 규모라면 데이터베이스가 필요함

 

웹 서버에서 동적으로 HTML을 생성하려면 제어용 프로그램이 필요한데, 웹 서버에는 CGI라 불리는 동적 콘텐츠를 위한 확장 방식이 있음. 이 CGI를 이용하여 프로그램과 웹 서버 간을 연동, 통신하여 처리함.

 

프로그래밍 언어로는 펄(Perl)이나 PHP, 루비(Ruby) 등의 스크립트 언어가 자주 사용됨. 윈도우의 경우는 ASP.NET이 많이 사용되며, 자바와 Servlet과 같은 조합도 존재.

 

실제 데이터베이스에 접속하는 것은 PHP나 루비 등의 프로그래밍 언어로 만들어진 CGI 프로그램으로, 데이터베이스 서버를 사용하기 위해서는 먼저 데이터베이스 서버와의 접속이 성립되어야 함. 그 후 데이터베이스에 필요한 SQL 명령을 전달하고, 실행 결과는 클라이언트로 되돌아감. 이때 웹 서버의 CGI 프로그램이 데이터베이스의 클라이언트가 됨.

 

클라이언트와 서버가 네트워크로 연결도어 있다면 서로 다른 기계에 두어도 무방하며, 이는 시스템 전체 성능을 향상시킴. 실제 대규모 시스템에서는 웹 서버나 데이터베이스 서버를 여러 대로 구성하여 운용하는 경우도 많음.

 

MySQL 서버와 mysql 클라이언트

 

MySQL 패키지를 PC에 설치하면 서버와 클라이언트 모두 사용할 수 있으며, MySQL 서비스가 데이터베이스 서버가 되고, mysql 커맨드가 클라이언트가 됨.

 

MySQL 서비스는 PC 기동과 함께 자동으로 실행된다 즉, PC 한 대로 클라이언트와 서버 모두 실행할 수 있음. 하지만 네트워크 기능이 필요함. 클라이언트에서 서버에 접속할 필요가 있는데, 이때 네트워크를 경유해서 PC의 서버로 되돌아오는 형태로 접속함. 이를 '루프 백 접속'이라고 부름.

 

🎯Review

🌐데이터베이스: 비휘발성 저장장치에 저장되는 영속된 데이터의 집합. 단지 저장만 하는 데 그치지 않고, 용이한 검색을 실현하도록 정리해 줌.🌐DBMS: 데이터베이스를 관리하는 소프트웨어🌐RDBMS: 데이터베이스를 관계형 모델로 관리하는 소프트웨어🌐SQL: RDBMS에서 데이터를 조작하는 명령🌐SQL 방언: 데이터베이스 제품 종류는 다양하며, 경우에 따라 표준과 다른 SQL 명령을 사용하기도 함. 이를 SQL 방언이라 부름.🌐데이터베이스 서버: RDBMS는 클라이언트/서버 모델로 구성되며, 클라이언트는 데이터베이스 서버에 접속해 SQL 명령을 실행하여 데이터베이스를 조작할 수 있음