씬디의 블로그
[정보처리기사 실기] 3. 데이터 입출력 구현 본문
정보처리기사
수제비2024 기출문제집으로 공부하면서 기록
1. 데이터 저장소
1. 데이터 모델
(1) 데이터 모델 개념
- 데이터 모델은 현실 세계의 정보를 인간과 컴퓨터가 이해할 수 있도록 추상화하여 표현한 모델이다
- 데이터 모델에 표시해야 할 요소에는 논리적 데이터 구조, 연산, 제약 조건이 있다
- 구조
- 데이터베이스에 논리적으로 표현될 대상으로서의 개체 타입과 개체 타입 간의 관계
- 연산
- 데이터베이스에 저장된 실제 데이터를 처리하는 작업에 대한 명세
- 제약 조건
- 데이터베이스에 저장될 수 있는 실제 데이터의 논리적인 제약 조건
(2) 데이터 모델 절차 [요개논물]
- 요구조건 분석
- 개념적 설계
- 논리적 설계
- 트랜잭션의 인터페이스를 설계하는 단계
- DBMS에 맞는 논리적 스키마를 설계하는 단계
- 물리적 설계
- 논리 데이터 모델을 사용하고자 하는 각 DBMS의 특성을 고려하여 데이터베이스 저장 구조(물리 데이터 모델)로 변환하는 모델
2. 논리 데이터 모델
(3) 관계 데이터 모델
1. 관계 데이터 모델
- 카디널리티
- 특정 데이터 집합의 유니크한 값의 개수
- 릴레이션 인스턴스
- 릴레이션 또는 릴레이션 외연(Relation Extension)라고도 한다
2. 관계 대수
1. 관계 대수 개념
관계형 데이터베이스에서 원하는 정보와 그 정보를 어떻게 유도하는가를 기술하는 절자척 정형 언어이다
2. 관계 대수 연산자의 종류
가. 일반 집합 연산자
나. 순수 관계 연산자
3. 관계 해석
1. 관계 해석 개념
관계 해석은 튜플 관계 해석과 도메인 관계 해석을 하는 비절차적 언어이다
(5) 개체-관계(E-R) 모델
1. 개체-관계(E-R) 모델 개념
E-R 모델은 현실 세계에 존재하는 데이터와 그들 간의 관계를 사람이 이해할 수 있는 형태로 명확하게 표현하기 위해서 가장 널리 사용되는 모델이다
(6) 정규화
1. 이상 현상
이상 현상은 데이터의 중복성으로 인해 릴레이션을 조작할 때 발생하는 비합리적 현상이다
삽입, 삭제, 갱신 이상이 있다
- 삽입
- 삭제
- 정보 삭제 시 원치 않는 다른 정보가 같이 삭제되는 경우
- 갱신
2. 함수 종속
1. 함수 종속 개념
함수 종속은 릴레이션에서 속성의 의미와 속성 간 상호 관계로부터 발생하는 제약조건이다
3. 함수 종속 종류
함수 종속에는 부분 함수 종속, 완전 함수 종속, 이행 함수 종속이 있다
3. 정규화의 개념
정규화는 관계형 데이터 모델에서 데이터의 중복성을 제거하여 이상 현상을 방지하고, 데이터의 일관성과 정확성을 유지하기 위해 무손실 분해하는 과정이다
(7) 반 정규화
1. 반 정규화 개념
반 정규화는 정규화된 엔티티, 속성, 관계에 대해 성능 향상과 개발 운영의 단순화를 위해 중복, 통합, 분리 등을 수행하는 데이터 모델링의 기법이다
3. 물리 데이터 모델
(1) 데이터베이스 무결성
(2) 키
1. 키 개념
키는 데이터베이스에서 조건을 만족하는 튜플을 찾거나 순서대로 정렬할 때 다른 튜플들과 구별할 수 있는 기준이 되는 속성이다
2. 키 특성
키 특성에는 유일성과 최소성이 있다
- 유일성
- 식별자에 의해 엔티티 내에 모든 튜플들을 유일하게 구분하는 특성
- 최소성
- 최소한의 속성으로 식별자를 구성하는 특성
3. 키 종류
- 기본 키 (Primary Key)
- 대체 키
- 후보 키
- 테이블에서 각 튜플을 구별하는 데 기준이 되는 키
- 슈퍼 키
- 릴레이션을 구성하는 모든 튜플에 대해 유일성은 만족하지만, 최소성은 만족하지 못하는 키
- 외래 키 (Foreign Key)
- 한 릴레이션의 컬럼이 다른 릴레이션의 기본 키로 이용되는 키
- 테이블 간의 참조 데이터 무결성을 위한 제약 조건
(3) 인덱스
- 인덱스는검색 연산의 최적화를 위해 데이터베이스 내 열에 대한 정보를 구성한 데이터 구조이다
- 인덱스를 통해 전체 데이터의 검색 없이 필요한 정보에 대해 신속한 조회가 가능하다
(4) 파티셔닝
1. 파티셔닝 개념
파티셔닝은 테이블 또는 인덱스 데이터를 파티션 단위로 나누어 저장하는 기법이다
2. 파티션의 유형
파티션의 유형에는 레인지 파티셔닝, 해시 파티셔닝, 리스트 파티셔닝, 컴포지트 파티셔닝, 라운드로빈이 있다
- 레인지 파티셔닝
- 레인지 파티셔닝은 연속적인 숫자나 날짜를 기준으로 하는 파티셔닝 기법이다
- 손쉬운 관리 기법을 제공하여 관리 시간의 단축이 가능하다
- 우편번호, 일별, 월별, 분기별 등의 데이터에 적합
- 해시 파티셔닝
- 리스트 파티셔닝
- 컴포지트 파티셔닝
- 라운드로빈
2. 데이터베이스 기초 활용
1. 데이터베이스 종류
(1) 데이터베이스
1. 데이터베이스 개념
데이터베이스는 통합된 데이터, 저장된 데이터, 운영 데이터, 공용 데이터이다
계층형 데이터베이스 관리시스템(HDBMS)는 데이터를 상하 종속적인 관계로 계층화하여 관리하는 데이터베이스이다. 데이터에 대한 접근 속도가 빠르지만, 종속적인 구조로 인하여 변화하는 데이터 구조에 유연하게 대응이 어렵다
2. 데이터베이스 특성
데이터베이스 특성에는 실시간 접근성, 계속적인 변화, 동시공용, 내용 참조가 있다
(2) 데이터베이스 저장 기술
2. 데이터 마트
3. 빅데이터 특성
빅데이터는 시스템, 서비스, 조직(회사) 등에서 주어진 비용, 시간 내에 처리 가능한 데이터 범위를 넘어서는 수십 페타바이트(PB) 크기의 비정형 데이터이다
(3) 하둡
1. 하둡 개념
- 하둡은 오픈 소스를 기반으로 한 분산 컴퓨팅 플랫폼이다
- 일반 PC 급 컴퓨터들로 가상화된 대형 스토리지를 형성하고 그 안에 보관된 거대한 데이터 세트를 병렬로 처리할 수 있도록 개발된 자바 소프트웨어 프레임워크이다
2. 하둡 주요 기술
3. NoSQL
1. NoSQL(Not Only SQL)의 개념
NoSQL은 전통적인 RDBMS와 다른 DBMS를 지칭하기 위한 용어로 데이터 저장에 고정된 테이블 스키마가 필요하지 않고 조인(Join) 연산을 사용할 수 없으며, 수평적으로 확장이 가능한 DBMS이다
2. NoSQL의 특성(BASE)
3. NoSQL의 유형
(4) 데이터 마이닝
1. 데이터 마이닝 개념
데이터 마이닝은 대규모로 저장된 데이터 안에서 체계적이고 자동적으로 통계적 규칙이나 패턴을 찾아내는 기술이다
2. 데이터 마이닝 주요 기법 [분연 연데]
(5) 데이터 관련 용어
'Qualifications > 정보처리기사' 카테고리의 다른 글
[정보처리기사 실기] 4. 통합 구현 (0) | 2024.07.08 |
---|---|
[정보처리기사 실기] 2. 화면 설계 (0) | 2024.07.04 |
[정보처리기사 실기] 1. 요구사항 확인 (0) | 2024.07.02 |
[정보처리기사 필기] 3. 데이터베이스 구축 (0) | 2024.05.23 |
[정보처리기사 필기] 2. 소프트웨어 개발 (0) | 2024.05.22 |