2023 정보처리기사 정리

정보처리기사 3강(데이터베이스 구축) 핵심 요약

choco2706 2024. 5. 6. 21:28

1. 개념적 설계(정보 모델링, 개념화)

  • 정보의 구조를 얻기 위하여 현실 세계에 대한 인식을 추상적 개념으로 표현하는 과정
  • 개념 스키마 모델링과 트랜잭션 모델링을 병행 수행한다.\

 

 

2. 논리적 설계(데이터 모델링)

  • 자료를 특정 DBMS가 지원하는 논리적 자료 구조로 변환(mapping)시키는 과정
  • 트랜잭션의 인터페이스를 설한다
  • 개념 스키마를 평가 및 정제한다

 

 

3. 물리적 설계

  • 논리적 구조로 표현된 데이터를 물리적 구조의 데이터로 변환하는 과정이다.
  • 데이터베이스 파일의 저장 구조 및 엑세스 경로를 결정한다
  • 저장 레코드의 형식, 순서, 접근 경로, 조회가 집중되는 레코드와 같은 정보를 사용한다. 

 

 

4. 데이터 모델에 표시할 요소

  • 구조(Structure) : 논리적으로 표현된 개체 타입들 간의 관계로서 데이터 구조 및 정적 성질을 표현함
  • 연산(Operation) : 데이터베이스에 저장된 실제 데이터를 처리하는 작업에 대한 명세로서 데이터베이스를 조작하는 기본 도구
  • 제약 조건(Constraint) : 데이터베이스에 저장될 수 있는 실제 데이터의 논리적인 제약 조건

 

 

5, ER다이어그램

 

 

6. 튜플(Tuple)

  • 릴레이션을 구성하는 각각의 행을 말한다.
  • 튜플의 수 = 카디널리티(Cardinality)

 

 

7. 속성(Attribute)

  • 데이터베이스를 구성하는 가장 작은 논리적 단위
  • 속성의 수 = 디그리(Degree) = 차수

 

 

8. 도메인

하나의 어트리뷰트가 취할 수 있는 같은 타입의 원자(Atomic)값들의 집합

 

 

9. 릴레이션의 특징

  • 한 릴레이션에는 똑같은 튜플이 포함될 수 없으므로 릴레이션에 포함된 튜플들은 모두 상이하다.
  • 한 릴레이션에 포함된 튜플 사이에 순서가 없다.
  • 속성의 유일한 식별을 위해 속성의 명칭은 유일해야 한다.
  • 속성의 값은 논리적으로 더 이상 쪼갤 수 없는 원자값만을 저장한다.

 

 

10.  후보 키(Candidate Key)

  • 릴레이션을 구성하는 속성들 중에서 튜플을 유일하게 식별하기 위해 사용하는 속성들의 부분 집합, 즉 기본키로 사용할 수 있는 속성들을 말한다.
  • 릴레이션에 있는 모든 튜플에 대해서 유일성과 최소성을 만족시켜야 한다.

 

 

11. 기본 키(Primary Key)

  • 후보키 중에서 특별히 선정된 주 키(Main Key)로 중복된 값을 가질 수 없다.
  • NULL값을 가져선 안된다.

 

 

12. 대체 키(Alternate Key)

  • 후보 키가 둘 이상일 때 기본키를 제외한 나머지 후보 키, 보조키라고도 한다.

 

 

13. 슈퍼 키(Super Key)

  • 한 릴레이션 내에 있는 속성들의 집합으로 구성된 키
  • 릴레이션을 구성하는 모든 튜플에 대해 유일성은 만족시키지만, 최소성은 만족시키지 못한다.

 

14. 외래 키(Foreign Key)

  • 다른 릴레이션의 기본키를 참조하는 속성 또는 속성들의 집합을 의미한다.
  • 한 릴레이션에 속한 속성 A와 참조 릴레이션의 기본 키인 B가 동일한 도메인상에서 정의되었을 때의 속성 A를 외래키라고 한다. 

 

 

15. 무결성

  • 개체 무결성 : 기본 테이블의 기본 키를 구성하는 어떤 속성도 NULL값이나 중복값을 가질 수 없다는 규정
  • 참조 무결성 : 외래키 값은 NULL이거나 참조 릴레이션의 기본 키 값과 동일해야 함. 즉 릴레이션은 참조할 수 없는 외래 키 값을 가질 수 없다는 규정

 

 

16. 관계 대수

  • 관계형 데이터베이스에서 원하는 정보와 그 정보를 검색하기 위해 어떻게 유도하는가를 기술하는 절차적인 언어
  • 질의에 대한 해를 구하기 위해 수행해야 할 연산의 순서를 명시한다

 

 

17. 순수 관계 연산자

  1. SELECT ( σ )
    • 릴레이션에 존재하는 튜플 중에서 선택 조건을 만족하는 튜플의 부분 집합을 구하여 새로운 릴레이션을 만드는 연산
  2. PROJECT ( π )
    • 주어진 릴레이션에서 속성 리스트에 제시된 속성 값만을 추출하여 새로운 릴레이션을 만드는 연산
  3.  JOIN (▷◁)
    • 공통 속성을 중심으로 두 개의 릴레이션을 하나로 합쳐서 새로운 릴레이션을 만드는 연산
  4. DIVISION ( ÷ )
    • X⊃Y인 두 개의 릴레이션 R(X)와 S(Y)가 있을 때, R의 속성이 S의 속성값을 모두 가진 튜플에서 S가 가진 속성을 제외한 속성만을 구하는 연산
  5. 일반 집합 연산자 - 교차곱(CARTESIAN PRODUCT)
    • 두 릴레이션에 있는 튜플들의 순서쌍을 구하는 연산
    • 교차곱의 디그리는 두 릴레이션의 디그리를 더한 것과 같다.
    • 교차곱의 카디널리티는 두 릴레이션의 카디널리티를 곱한 것과 같다.

 

 

18. 관계 해석 

  • 관계 데이터 모델의 제안자인 코드(Codd)가 수학의 Predicate Carculus(술어 해석)에 기반을 두고 관계 데이터베이스를 위해 제안했다.

주요 기호

 

 

19. 정규화(Normalization)

  • 함수적 종속성 등의 종속성 이론을 이용하여 잘못 설계된 관계형 스키마를 더 작은 속성의 세트로 쪼개어 바람직한 스키마로 만들어가는 과정
  • 논리적 설계 단계에서 수행한다.
  • 데이터 중복을 배제하여 이상(Anomaly)의 발생을 방지한다.
  • 자료 저장 공간의 최소화가 가능하다

 

 

20. 이상(Anomaly)

  • 정규화를 거치지 않으면 데이터베이스 내에 데이터들이 불필요하게 중복되어 릴레이션 조작 시 예기치 못한 곤란한 현상이 발생하는 것을 의미한다.
  • 종류 : 삽입 이상, 삭제 이상, 갱신 이상

 

 

21. 정규화 과정

정규화 과정

 

 

22. 함수적 종속(Functional Dependency)

  • 데이터들이 어떤 기준값에 의해 종속되는 것을 의미
  • '학번'에 따라 '이름'이 결정될 때 '이름'을 '학번'에 함수 종속적이라고 하며 '학번 → 이름'과 같이 쓴다

 

 

23. 이행적 종속 관계

A → B이고 B → C일 때 A → C를 만족하는 관계를 의미

 

 

24. 시스템 카탈로그(System Catalog, 데이터 사전)

  • 시스템 그 자체에 관련이 있는 다양한 객체에 관한 정보를 포함하는 시스템 데이터베이스이다.
  • 사용자가 시스템 카탈로그 내용을 검색할 수는 있지만 갱신할 수는 없다.

 

 

25. 트랜잭션(Transaction)

  • 데이터베이스의 상태를 변환시키는 하나의 논리적 기능을 수행하기 위한 작업의 단위
  • 한꺼번에 모두 수행되어야 할 일련의 연산
    1. 트랜젝션의 상태
      • 활동(Active) : 트랜잭션이 실행 중인 상태
      • 실패(Failed) : 트랜잭션 실행 중 오류가 발생하여 중단된 상태
      • 철회(Aborted) : 트랜잭션이 비정상적으로 종료되어 Rollback 연산을 수행한 상태
      • 부분 완료(Partially Committed) : 트랜잭션의 마지막 연산까지 완료했지만, Commit 연산이 실행되기 직전의 상태
      • 완료(Committed) : 트랜잭션이 성공적으로 종료되어 Commit 연산까지 수행한 상태
    2. 트랜잭션의 특성
      • Atomicity(원자성) : 트랜잭션의 연산은 데이터베이스에 모두 반영되도록 완료(Commit)되든지 아니면 전혀 반영되지 않도록 복구(Rollback)되어야 함
      • Consistency(일관성) : 트랜잭션이 그 실행을  성공적으로 완료하면 언제나 일관성 있는 데이터베이스 상태로 변환함
      • Isolation(독립성) : 둘 이상의 트랜잭션이 동시에 병행 실행되는 경우 어느 하나의 트랜잭션 실행중에 다른 트랜잭션의 연산이 끼어들 수 없음
      • Durability(영속성) : 성공적으로 완료된 트랜잭션의 결과는 시스템이 고장나더라고 영구적으로 반영되어야 함

 

 

26. 인덱스(Index)

  • 데이터 레코드를 빠르게 접근하기 위해 <키 값, 포인터> 쌍으로 구성되는 데이터 구조이다.
  • 데이터 정의어(DDL)를 이용하여 사용자가 생성, 변경, 제거할 수 있다.

 

 

27. 뷰(View)

  • 기본 테이블로부터 유도된, 이름을 가지는 가상 테이블
  • 뷰는 가상 테이블이기 때문에 물리적으로 구현되어있지 않다.
  • 뷰로 구성된 내용에 대한 삽입, 삭제, 갱신 연산에 제약이 따른다.
  • 뷰를 정의할 때 CREATE, 제거할 때는 DROP을 사용한다.
  • 독립적인 인덱스를 가질 수 없다.

 

 

28. 파티션의 종류

  • 범위 분할(Range Partitioning) : 지정한 열 값을 기준으로 범위를 지정하여 분할. Ex)일별, 월별, 분기별 등
  • 해시 분할(Hash Partitioning) : 해시 함수를 적용한 결과 값에 따라 데이터를 분할
  • 조합 분할(Composite Partitioning) : 범위 분할로 분할한 다음 해시 함수를 적용하여 다시 분할하는 방식
  • 목록 분할(List Partitioning) : 지정한 열 값에 대한 목록을 만들어 이를 기준으로 분할
  • 라운드 로빈 분할(Round Robin Partitioning) : 레코드를 균일하게 분배하는 방식

 

 

29. 분산 데이터베이스

  • 논리적으로는 하나의 시스템에 속하지만 물리적으로는 네트워크를 통해 연결된 여러 개의 컴퓨터 사이트(Site)에 분산되어 있는 데이터베이스를 말한다.
  • 데이터베이스 설계 및 소프트웨어 개발이 어렵다.
  • 분산 데이터베이스의 구성 요소 : 분산 처리기, 분산 데이터베이스, 통신 네트워크
    1. 분산 데이터베이스의 목표
      • 위치 투명성(Location Transparency) : 엑세스하려는 데이터베이스의 실제 위치를 알 필요 없이 단지 데이터베이스의 논리적인 명칭만으로 엑세스할 수 있음.
      • 중복 투명성(Relication Transparency) : 동일 데이터가 여러 곳에 중복되어 있더라고 사용자는 마치 하나의 데이터만 존재하는 것처럼 사용하고, 시스템은 자동으로 여러 자료에 대한 작업을 수행함
      • 병행 투명성(Concurrency Transparency) : 분산 데이터베이스와 관련된 다수의 트랜잭션들이 동시에 실현되더라도 그 드랜잭션의 결과는 영향을 받지 않음
      • 장애 투명성(Failure Transparency) : 트랜잭션, DBMS, 네트워크, 컴퓨터 장애에도 불구하고 트랜잭션을 정확하게 처리함.

 

 

30. 암호화 · 복호화 과정

  • 암호화(Encryption) 과정 : 암호회되지 않은 평문을 정보 보호를 위해 암호문으로 바꾸는 과정
  • 복호화(Decryption) 과정 : 암호문을 원래의 평문으로 바꾸는 과정

 

 

31. 접근 통제 기술

  • 임의 접근 통제(DAC; Discretionary Access Control) : 데이터에 접근하는 사용자의 신원에 따라 접근 권한을 부여하는 방식
  • 강제 접근 통제(MAC; Mandatory Access Control) : 주체와 객체의 등급을 비교하여 접근 권한을 부여하는 방식
  • 역할기반 접근 통제(RMAC; Role Bassed Access Control) : 사용자의 역할에 따라 접근 권한을 부여하는 방식

 

 

32. DDL( Data Definition Language )

  • 스키마, 도메인, 테이블, 뷰, 인덱스를 정의하거나 변경 또는 삭제할 때 사용하는 언어
  • CREATE : 스키마, 도메인, 테이블, 뷰, 인덱스를 정의
  • ALTER : TABLE에 대한 정의를 변경하는데 사용
  • DROP : 스키마, 도메인, 테이블, 뷰, 인덱스를 삭제

 

 

33. DML( Data Manipulation Language )

  • 데이터베이스 사용자가 응용 프로그램이나 질의어를 통하여 저장된 데이터를 실질적으로 처리하는 데 사용되는 언어이다.
  • SELECT : 테이블에서 조건에 맞는 튜플을 검색
  • INSERT : 테이블에서 새로운 튜플을 삽입
  • DELETE : 테이블에서 조건에 맞는 튜플을 삭제
  • UPDATE : 테이블에서 조건에 맞는 튜플의 내용을 변경함.

 

 

34. DCL( Data Control Language )

  • 데이터의 보안, 무결성, 회복, 병행 수행 제어 등을 정의하는데 사용되는 언어
  • COMMIT : 명령에 의해 수행된 결과를 실제 물리적 디스크로 저장하고, 데이터베이스 조작 작업이 정상적으로 완료되었음을 관리자한테 알려줌
  • ROLLBACK : 데이터베이스 조작 작업이 비정상적으로 종료되었을 때 원래의 상태로 복구
  • GRANT : 데이터베이스 사용자에게 사용 권한을 부여
  • REVOKE : 데이터베이스 사용자의 사용 권한을 취소

 

 

35. 트리거(Trigger)

데이터의 삽입(Insert), 갱신(Update), 삭제(Delete) 등의 이벤트(Event)가 발생할 때마다 관련 작업이 자동으로 수행되는 절차형 SQL

 

 

36. 집합 연산자의 종류

  • UNION : 두 조회 결과를 통합하여 모두 출력하되, 중복된 행은 한 번만 출력함
  • UNION ALL : 두 조회 결과를 통합하여 모두 출력하되, 중복된 행도 그대로 출력
  • INTERSECT : 두 조회 결과 중 공통된 행만 출력
  • EXCEPT : 첫 번째 조회 결과에서 두 번째 조회 결괴를 제외한 행을 출력함