정보처리기사 3강(데이터베이스 구축) 핵심 요약

2023 정보처리기사 정리

정보처리기사 3강(데이터베이스 구축) 핵심 요약

choco2706 2024. 5. 6. 21:28

1. 개념적 설계(정보 모델링, 개념화)

정보의 구조를 얻기 위하여 현실 세계에 대한 인식을 추상적 개념으로 표현하는 과정
개념 스키마 모델링과 트랜잭션 모델링을 병행 수행한다.\

2. 논리적 설계(데이터 모델링)

자료를 특정 DBMS가 지원하는 논리적 자료 구조로 변환(mapping)시키는 과정
트랜잭션의 인터페이스를 설계한다
개념 스키마를 평가 및 정제한다

3. 물리적 설계

논리적 구조로 표현된 데이터를 물리적 구조의 데이터로 변환하는 과정이다.
데이터베이스 파일의 저장 구조 및 엑세스 경로를 결정한다
저장 레코드의 형식, 순서, 접근 경로, 조회가 집중되는 레코드와 같은 정보를 사용한다.

4. 데이터 모델에 표시할 요소

구조(Structure) : 논리적으로 표현된 개체 타입들 간의 관계로서 데이터 구조 및 정적 성질을 표현함
연산(Operation) : 데이터베이스에 저장된 실제 데이터를 처리하는 작업에 대한 명세로서 데이터베이스를 조작하는 기본 도구
제약 조건(Constraint) : 데이터베이스에 저장될 수 있는 실제 데이터의 논리적인 제약 조건

5, ER다이어그램

6. 튜플(Tuple)

릴레이션을 구성하는 각각의 행을 말한다.
튜플의 수 = 카디널리티(Cardinality)

7. 속성(Attribute)

데이터베이스를 구성하는 가장 작은 논리적 단위
속성의 수 = 디그리(Degree) = 차수

8. 도메인

하나의 어트리뷰트가 취할 수 있는 같은 타입의 원자(Atomic)값들의 집합

9. 릴레이션의 특징

한 릴레이션에는 똑같은 튜플이 포함될 수 없으므로 릴레이션에 포함된 튜플들은 모두 상이하다.
한 릴레이션에 포함된 튜플 사이에 순서가 없다.
속성의 유일한 식별을 위해 속성의 명칭은 유일해야 한다.
속성의 값은 논리적으로 더 이상 쪼갤 수 없는 원자값만을 저장한다.

10. 후보 키(Candidate Key)

릴레이션을 구성하는 속성들 중에서 튜플을 유일하게 식별하기 위해 사용하는 속성들의 부분 집합, 즉 기본키로 사용할 수 있는 속성들을 말한다.
릴레이션에 있는 모든 튜플에 대해서 유일성과 최소성을 만족시켜야 한다.

11. 기본 키(Primary Key)

후보키 중에서 특별히 선정된 주 키(Main Key)로 중복된 값을 가질 수 없다.
NULL값을 가져선 안된다.

12. 대체 키(Alternate Key)

후보 키가 둘 이상일 때 기본키를 제외한 나머지 후보 키, 보조키라고도 한다.

13. 슈퍼 키(Super Key)

한 릴레이션 내에 있는 속성들의 집합으로 구성된 키
릴레이션을 구성하는 모든 튜플에 대해 유일성은 만족시키지만, 최소성은 만족시키지 못한다.

14. 외래 키(Foreign Key)

다른 릴레이션의 기본키를 참조하는 속성 또는 속성들의 집합을 의미한다.
한 릴레이션에 속한 속성 A와 참조 릴레이션의 기본 키인 B가 동일한 도메인상에서 정의되었을 때의 속성 A를 외래키라고 한다.

15. 무결성

개체 무결성 : 기본 테이블의 기본 키를 구성하는 어떤 속성도 NULL값이나 중복값을 가질 수 없다는 규정
참조 무결성 : 외래키 값은 NULL이거나 참조 릴레이션의 기본 키 값과 동일해야 함. 즉 릴레이션은 참조할 수 없는 외래 키 값을 가질 수 없다는 규정

16. 관계 대수

관계형 데이터베이스에서 원하는 정보와 그 정보를 검색하기 위해 어떻게 유도하는가를 기술하는 절차적인 언어
질의에 대한 해를 구하기 위해 수행해야 할 연산의 순서를 명시한다

17. 순수 관계 연산자

SELECT ( σ )
- 릴레이션에 존재하는 튜플 중에서 선택 조건을 만족하는 튜플의 부분 집합을 구하여 새로운 릴레이션을 만드는 연산
PROJECT ( π )
- 주어진 릴레이션에서 속성 리스트에 제시된 속성 값만을 추출하여 새로운 릴레이션을 만드는 연산
JOIN (▷◁)
- 공통 속성을 중심으로 두 개의 릴레이션을 하나로 합쳐서 새로운 릴레이션을 만드는 연산
DIVISION ( ÷ )
- X⊃Y인 두 개의 릴레이션 R(X)와 S(Y)가 있을 때, R의 속성이 S의 속성값을 모두 가진 튜플에서 S가 가진 속성을 제외한 속성만을 구하는 연산
일반 집합 연산자 - 교차곱(CARTESIAN PRODUCT)
- 두 릴레이션에 있는 튜플들의 순서쌍을 구하는 연산
- 교차곱의 디그리는 두 릴레이션의 디그리를 더한 것과 같다.
- 교차곱의 카디널리티는 두 릴레이션의 카디널리티를 곱한 것과 같다.

18. 관계 해석

관계 데이터 모델의 제안자인 코드(Codd)가 수학의 Predicate Carculus(술어 해석)에 기반을 두고 관계 데이터베이스를 위해 제안했다.

19. 정규화(Normalization)

함수적 종속성 등의 종속성 이론을 이용하여 잘못 설계된 관계형 스키마를 더 작은 속성의 세트로 쪼개어 바람직한 스키마로 만들어가는 과정
논리적 설계 단계에서 수행한다.
데이터 중복을 배제하여 이상(Anomaly)의 발생을 방지한다.
자료 저장 공간의 최소화가 가능하다

20. 이상(Anomaly)

정규화를 거치지 않으면 데이터베이스 내에 데이터들이 불필요하게 중복되어 릴레이션 조작 시 예기치 못한 곤란한 현상이 발생하는 것을 의미한다.
종류 : 삽입 이상, 삭제 이상, 갱신 이상

21. 정규화 과정

22. 함수적 종속(Functional Dependency)

데이터들이 어떤 기준값에 의해 종속되는 것을 의미
'학번'에 따라 '이름'이 결정될 때 '이름'을 '학번'에 함수 종속적이라고 하며 '학번 → 이름'과 같이 쓴다

23. 이행적 종속 관계

A → B이고 B → C일 때 A → C를 만족하는 관계를 의미

24. 시스템 카탈로그(System Catalog, 데이터 사전)

시스템 그 자체에 관련이 있는 다양한 객체에 관한 정보를 포함하는 시스템 데이터베이스이다.
사용자가 시스템 카탈로그 내용을 검색할 수는 있지만 갱신할 수는 없다.

25. 트랜잭션(Transaction)

데이터베이스의 상태를 변환시키는 하나의 논리적 기능을 수행하기 위한 작업의 단위
한꺼번에 모두 수행되어야 할 일련의 연산
1. 트랜젝션의 상태
  - 활동(Active) : 트랜잭션이 실행 중인 상태
  - 실패(Failed) : 트랜잭션 실행 중 오류가 발생하여 중단된 상태
  - 철회(Aborted) : 트랜잭션이 비정상적으로 종료되어 Rollback 연산을 수행한 상태
  - 부분 완료(Partially Committed) : 트랜잭션의 마지막 연산까지 완료했지만, Commit 연산이 실행되기 직전의 상태
  - 완료(Committed) : 트랜잭션이 성공적으로 종료되어 Commit 연산까지 수행한 상태
2. 트랜잭션의 특성
  - Atomicity(원자성) : 트랜잭션의 연산은 데이터베이스에 모두 반영되도록 완료(Commit)되든지 아니면 전혀 반영되지 않도록 복구(Rollback)되어야 함
  - Consistency(일관성) : 트랜잭션이 그 실행을 성공적으로 완료하면 언제나 일관성 있는 데이터베이스 상태로 변환함
  - Isolation(독립성) : 둘 이상의 트랜잭션이 동시에 병행 실행되는 경우 어느 하나의 트랜잭션 실행중에 다른 트랜잭션의 연산이 끼어들 수 없음
  - Durability(영속성) : 성공적으로 완료된 트랜잭션의 결과는 시스템이 고장나더라고 영구적으로 반영되어야 함

26. 인덱스(Index)

데이터 레코드를 빠르게 접근하기 위해 <키 값, 포인터> 쌍으로 구성되는 데이터 구조이다.
데이터 정의어(DDL)를 이용하여 사용자가 생성, 변경, 제거할 수 있다.

27. 뷰(View)

기본 테이블로부터 유도된, 이름을 가지는 가상 테이블
뷰는 가상 테이블이기 때문에 물리적으로 구현되어있지 않다.
뷰로 구성된 내용에 대한 삽입, 삭제, 갱신 연산에 제약이 따른다.
뷰를 정의할 때 CREATE문, 제거할 때는 DROP문을 사용한다.
독립적인 인덱스를 가질 수 없다.

28. 파티션의 종류

범위 분할(Range Partitioning) : 지정한 열 값을 기준으로 범위를 지정하여 분할. Ex)일별, 월별, 분기별 등
해시 분할(Hash Partitioning) : 해시 함수를 적용한 결과 값에 따라 데이터를 분할
조합 분할(Composite Partitioning) : 범위 분할로 분할한 다음 해시 함수를 적용하여 다시 분할하는 방식
목록 분할(List Partitioning) : 지정한 열 값에 대한 목록을 만들어 이를 기준으로 분할
라운드 로빈 분할(Round Robin Partitioning) : 레코드를 균일하게 분배하는 방식

29. 분산 데이터베이스

논리적으로는 하나의 시스템에 속하지만 물리적으로는 네트워크를 통해 연결된 여러 개의 컴퓨터 사이트(Site)에 분산되어 있는 데이터베이스를 말한다.
데이터베이스 설계 및 소프트웨어 개발이 어렵다.
분산 데이터베이스의 구성 요소 : 분산 처리기, 분산 데이터베이스, 통신 네트워크
1. 분산 데이터베이스의 목표
  - 위치 투명성(Location Transparency) : 엑세스하려는 데이터베이스의 실제 위치를 알 필요 없이 단지 데이터베이스의 논리적인 명칭만으로 엑세스할 수 있음.
  - 중복 투명성(Relication Transparency) : 동일 데이터가 여러 곳에 중복되어 있더라고 사용자는 마치 하나의 데이터만 존재하는 것처럼 사용하고, 시스템은 자동으로 여러 자료에 대한 작업을 수행함
  - 병행 투명성(Concurrency Transparency) : 분산 데이터베이스와 관련된 다수의 트랜잭션들이 동시에 실현되더라도 그 드랜잭션의 결과는 영향을 받지 않음
  - 장애 투명성(Failure Transparency) : 트랜잭션, DBMS, 네트워크, 컴퓨터 장애에도 불구하고 트랜잭션을 정확하게 처리함.

30. 암호화 · 복호화 과정

암호화(Encryption) 과정 : 암호회되지 않은 평문을 정보 보호를 위해 암호문으로 바꾸는 과정
복호화(Decryption) 과정 : 암호문을 원래의 평문으로 바꾸는 과정

31. 접근 통제 기술

임의 접근 통제(DAC; Discretionary Access Control) : 데이터에 접근하는 사용자의 신원에 따라 접근 권한을 부여하는 방식
강제 접근 통제(MAC; Mandatory Access Control) : 주체와 객체의 등급을 비교하여 접근 권한을 부여하는 방식
역할기반 접근 통제(RMAC; Role Bassed Access Control) : 사용자의 역할에 따라 접근 권한을 부여하는 방식

32. DDL( Data Definition Language )

스키마, 도메인, 테이블, 뷰, 인덱스를 정의하거나 변경 또는 삭제할 때 사용하는 언어
CREATE : 스키마, 도메인, 테이블, 뷰, 인덱스를 정의함
ALTER : TABLE에 대한 정의를 변경하는데 사용
DROP : 스키마, 도메인, 테이블, 뷰, 인덱스를 삭제함

33. DML( Data Manipulation Language )

데이터베이스 사용자가 응용 프로그램이나 질의어를 통하여 저장된 데이터를 실질적으로 처리하는 데 사용되는 언어이다.
SELECT : 테이블에서 조건에 맞는 튜플을 검색함
INSERT : 테이블에서 새로운 튜플을 삽입함
DELETE : 테이블에서 조건에 맞는 튜플을 삭제함
UPDATE : 테이블에서 조건에 맞는 튜플의 내용을 변경함.

34. DCL( Data Control Language )

데이터의 보안, 무결성, 회복, 병행 수행 제어 등을 정의하는데 사용되는 언어
COMMIT : 명령에 의해 수행된 결과를 실제 물리적 디스크로 저장하고, 데이터베이스 조작 작업이 정상적으로 완료되었음을 관리자한테 알려줌
ROLLBACK : 데이터베이스 조작 작업이 비정상적으로 종료되었을 때 원래의 상태로 복구함
GRANT : 데이터베이스 사용자에게 사용 권한을 부여
REVOKE : 데이터베이스 사용자의 사용 권한을 취소

35. 트리거(Trigger)

데이터의 삽입(Insert), 갱신(Update), 삭제(Delete) 등의 이벤트(Event)가 발생할 때마다 관련 작업이 자동으로 수행되는 절차형 SQL

36. 집합 연산자의 종류

UNION : 두 조회 결과를 통합하여 모두 출력하되, 중복된 행은 한 번만 출력함
UNION ALL : 두 조회 결과를 통합하여 모두 출력하되, 중복된 행도 그대로 출력함
INTERSECT : 두 조회 결과 중 공통된 행만 출력함
EXCEPT : 첫 번째 조회 결과에서 두 번째 조회 결괴를 제외한 행을 출력함