3 minute read

DBMS에 대해서 설명하시오


Data Bases Management System 의 약자이며

기존 답안은 해석 그대로 데이터베이스 관리 시스템이라고 적어 오답노트를 적게 되었다.. ㅠ

DBMS란 ?

데이터베이스를 운영하고 관리하는 소프트웨어로 계층형, 망형, 관계형 DBMS 중 대부분의 DBMS가 테이블로 구성된 관계형 형태로 사용한다.

요약하자면 데이터베이스 관리 시스템이고, 하는 일은 응용 프로그램들이 데이터베이스를 공유하며 사용할 수 있는 환경을 제공하는 소프트 웨어이다.

데이터베이스 설계 절차를 나열하시오


요구 분석이 아닌 유형 분석이라고 답을 작성해서 오답노트를 작성한다.

데이터베이스의 설계 절차는

요구사항분석 → 개념적 설계 → 논리적 설계 → 물리적 설계 → 구현이다.

사용 목적, 사용 범위, 제약 조건 등을 정리하며 명세서 작성하는 과정은?


요구분석 단계!! 유형분석 아님!!!!

DBMS 독립적인 E-R모델 작성 , 정보를 추상적인 개념으로 표현하는 과정은?


개념적 설계!!

CRM 이란?


고객관리 시스템 이라고 작성했으나,

정확한 뜻은 데이터베이스를 분석하고 고객의 이해를 돕고, 이를 바탕으로 각종 마케팅 전략을 통해 높은 이익을 창출하는 시스템

한마디로 고객관리 시스템이긴 하나, 높은이익을 창출한다고 하는 것을 보아 백화점 vip 같은 접대 시스템에 CRM 이 도입되지 않았나 생각이 든다.. CRM 하면 백화점 vip 라고 외워야겠다 ㅋㅋ

SCM 이란?


supply chain management : 한국어로 직역하면 공급망 관리

자세한 뜻은 유통공급망에 참여하는 모든 업체들이 협력을 바탕으로 정보기술 활용이라는 뜻이다.

업체들의 협력 = 유통공급망 활성화 → 그에 대한 정보력도 상승함

이라고 이해했다.

데이터 웨어하우스 특징 4가지와 설명


데이터의 통합 - 전사적 차원에서 일관된 형식으로 지원

데이터의 시계열성 - 시간의 흐름에 따라 변화하는값 (여러 데이터의 공급으로 시간에 따라 당연히 변화한다.)

데이터의 데이터의 주체 지향적 ,비소멸성 - 특정 주체에 따라 데이터들이 분류, 저장된다. (당연히 정리는 카테고리 별로 분류하는 것이 인지상정)

으로 나눌 수 있다.

나는 데이터의 “통(동)시주(준)비” 로 암기했다 가 안외워졌다.

그래서 정리한다.

데이터 웨어하우스의 특징 4가지는 데이터의 동시준비!!!!

데이터를 모아두고 활용하는것이니 데이터가 동시 준비되어 언제든 활용될 수 있다… 외우자

ERP 란 ?


Entity Relationship Diagram

한국어로 직역하면 엔티티 관계 다이어그램이다. 나도 ERD를 많이 접해보았는데 왜 틀렸는가.. ? 내가 생각한 뜻은 데이터베이스 구조를 한눈에 알아보기 위해서 쓰인다 라고만 알고있었지만,

빅데이터에서는 다양한 비즈니스 분야에서 주요 프로세스 관리를 돕는 통합 애플리케이션 패키지로 나와있다.

프로세스 관리를 돕는 애플리케이션라고 외우면 될 것 같다.

ERD도 설계에서는 꼭 필요한 프로그램 = 프로세스를 돕는다.

BI 란 ?


Business Intelligence 를 풀어쓰면 비즈니스 지능? 정보? 라고 할 수있다.

데이터를 통합 분석하여 기업 활동에 연관된 의사결정을 돕는 프로세스를 말한다고 한다.

이건 그냥 외워야 할 것같다..

빅데이터의 출현 배경은 무엇인가?


산업계 관점의 양질 전환 법칙

인간 게놈 프로젝트

디지털화, 저장기술, 인터넷 보급, 모바일 혁명, 클라우드 컴퓨팅 등 관련된 기술 발전과 연관있음

소셜 미디어, 영상 등 비정형 데이터 확산

데이터 처리기술 발전

빅데이터 출현까지 너무 많은 요소와 요인들이 있어 간략하게 추려보자면, 소셜미디어, 영상, 비정형데이터 확산과 데이터 처리기술 발전이라고 외우고, 인간게놈프로젝트와, 양질 전환 법칙 같은 경우는 알아둬야할 것 같다.

빅데이터의 가치선정이 어려운 이유 3가지 서술하시오


데이터의 활용방식, 새로운 가치 창출, 분석기술 발달

위에서 말했듯이 데이터 처리 기술의 발달로 빅데이터가 등장했고,

알고리즘 등등 여러 요인으로 새로운 가치 창출을 하며, 분석하는 기술 또한 발전(새로운 분석기술로 평범한 모래가 활용성 좋은 금으로 취급) 하기 때문에 가치선정이 어렵다.

사전처리란?


표준화된 문서 포맷

사후처리란?


데이터를 모은 뒤 그 안에서 숨은 정보를 찾아냄

비식별화 기법 6가지는?


데이터 마스킹 - 개인정보 일부 가리기

데이터 범주화 - 변수가 가질 수 있는 가능한 값을 구간으로 나눔

가명화 - 개인식별 정보를 삭제 알아볼 수 없는 형태로 변환

잡음첨가 - 자료에 잡음을 추가해 원래 자료를 변형시킴

총계화/ 평균값 대체 - 데이터의 총합값을 보임으로 개별 데이터를 숨김

데이터값 삭제 - 필요없는 값 또는 개인 식별에 중요한 값 삭제

  • 적 통찰이 없는 의 함정이다.

  • 적인 분석 vs [ ]을 위한 기반 분석

데이터 사이언티스트가 갖춰야 할 스킬 2가지는 ?


소프트 스킬, 하드 스킬

데이터 사이언티스트가 갖춰야 할 스킬 2가지에 대한 설명을 서술하시오


소프트 스킬 - 설득력 있는 전달, 다분야간 협력

하드 스킬 - 머신 러닝 , 이론적 지식과 분석에 대한 숙련도

데이터 사이언티스트가 효과적인 분석 모델을 개발하기 위해 고려해야 할 상황 4가지는?


현실세계를 살피고 경험과 세상에 대한 통찰력 활용

가정들과 현실의 불일치에 대해 끊임없이 고찰, 모델에 대한 의구심

분석의 객관성에 대해 의구심을 가지고 해석의 개입등 한계치를 고려한다.

모델 범위 외부요인은 판단하지 않는다!

해당 부분을 암기가 아닌 읽고 숙지해두면 좋을 것 같다!

데이터 사이언티스트에 요구되는 인문학적 사고 2가지는?


이건 당연히 정보와 통찰력 !!

가치 패러다임의 3가지 변화는?


Digitallization(디지털화), connection(연결), Agency(에이전시)

DCA 로 외우자!ㅍ

Leave a comment