ADsP 1๊ณผ๋ชฉ 3-3 ๋น ๋ฐ์ดํฐ ๊ทธ๋ฆฌ๊ณ ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค์ ๋ฏธ๋ | ์ ๋ฆฌ๐
3. ๋น ๋ฐ์ดํฐ ๊ทธ๋ฆฌ๊ณ ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค์ ๋ฏธ๋
๊ธ๋ณํ๋ ํ๊ฒฝ์์ ์์ธกํ์ง ๋ชปํ๋ ์ ํ์ด๋ ์๊ธฐ์ ๋นจ๋ฆฌ ์ ์ํ ์ ์๊ฒ ํ ๊ฒ
์๋นํ์ด์ ์ด์ (Servitization)
- Service Science์ ํ๋๋ก ์ ํ๊ณผ ์๋น์ค์ ๊ฒฐํฉ์ ํตํ ๊ธฐ์ ์ ์๋ก์ด ๋น์ฆ๋์ค ๋ชจ๋ธ์
- ์ ํ์ ์๋น์คํ์ ์๋น์ค์ ์ํํ๋ฅผ ๋ชจ๋ ํฌํจํ๋ ๊ฒฐํฉ ๋ชจ๋ธ
- ํ์ดํ ๋ผ์ธ ๋น์ฆ๋์ค๋ฅผ ๋์ด ํ๋ซํผ ๋น์ฆ๋์ค๋ฅผ ์ํ ๋ชจ๋ธ
๋ฏธ๋ ์ฌํ์ ํน์ฑ๊ณผ ๋น ๋ฐ์ดํฐ์ ์ญํ
- ์ตํฉ — ์ฐฝ์กฐ๋ ฅ
- ๋ฆฌ์คํฌ — ๋์๋ ฅ
- ๋ถํ์ค์ฑ — ํต์ฐฐ๋ ฅ
- ์ค๋งํธ — ๊ฒฝ์๋ ฅ
๋ฏธ๋ ๊ฐ์น ํจ๋ฌ๋ค์์ ๋ณํ์์ ๋น ๋ฐ์ดํฐ ๋ถ์ ํ์ฉ ๋ฅ๋ ฅ์ ํต์ฌ์ ์ธ ์ญํ ์
๋์งํธํ(Digitalization) → ์ฐ๊ฒฐ(Connection) → ์์ด์ ์(Agency)
๊ธฐ์ ์ ๋น ๋ฐ์ดํฐ ๋ถ์์ ๊ธฐ์ ์ ๋ถ์ ๋ฌธํ์ ์ํฅ์ ๋ง์ด ๋ฐ์
์ฌ๊ธฐ์ DBMS์ ํน์ง, ๊ฐ์ธ์ ๋ณด ๋น์๋ณ ๊ธฐ์ ๋ด์ฉ์ด ์ค์ํด์
๊ฐ๋ ๋ฐ์ดํฐ์์ ๋จ์ ๋ฌธ์ ๋ ์ถ์ ๋ฉ๋๋ค
๋ฌธ์ ํ๊ณ ์ ๋ฆฌํ ๋ด์ฉ ๋ฃ์ด ๋ ๊ฑฐ๋ผ ๊ธฐ์ถ์ ํ ๋ฒ์ฉ์ ์๋ค๊ณ ์๊ฐํด ์ฃผ์ธ์
์ต์ ๋น ๋ฐ์ดํฐ ์์
DBMS(Database Management System)
์ฌ์ฉ์์ ๋ฐ์ดํฐ๋ฒ ์ด์ค ์ฌ์ด์์ ์ฌ์ฉ์์ ์๊ตฌ์ ๋ฐ๋ผ ์ ๋ณด๋ฅผ ์ฒ๋ฆฌํด์ฃผ๊ณ ๋ฐ์ดํฐ๋ฒ ์ด์ค๋ฅผ ๊ด๋ฆฌ, ์ด์ํ๋ ์ํํธ์จ์ด
- ์ ์, ์กฐ์, ์ ์ด๋ผ๋ 3๊ฐ์ง ํ์ ๊ธฐ๋ฅ์ด ์์
- ๋ฐ์ดํฐ๋ฒ ์ด์ค์๋ ๋ถ์์ด ๋ถ๊ฐํ ๋ฐ์ดํฐ๋ ์์ (์ฒ๋ฆฌ ๋ฑ์ ํตํด ๋ถ์์ ํ์ฉ ๊ฐ๋ฅ)
- DBMS ์ํํธ์จ์ด๋ฅผ ์ฌ์ฉํด ๋ฐ์ดํฐ๋ฒ ์ด์ค๋ฅผ ๊ตฌ์ถํ๊ณ ์ ์งํจ
- RDBMS๋ ๋ฐ์ดํฐ๋ฅผ 2์ฐจ์ ํ
์ด๋ธ๋ก ํํํ์ง๋ง, ๋ชจ๋ ๋ฐ์ดํฐ๊ฐ ์ด๋ฐ ๋ฐฉ์์ ์๋
NoSQL ๋ฐ์ดํฐ๋ฒ ์ด์ค๋ ๋ถ์, key-๊ฐ, ๊ทธ๋ํ ๋ฑ ๋ค์ํ ๋ฐ์ดํฐ ๋ชจ๋ธ์ ์ฌ์ฉํจ - ๊ด๊ณํ(Relational)
DBMS ํ ์ด๋ธ ๊ธฐ๋ฐ์ผ๋ก ์ผ๋ฐ์ ์ผ๋ก ์ฌ์ฉํจ - ๊ฐ์ฒด์งํฅ(Object-Oriented) DBMS
๊ฐ์ฒด ํํ๋ก ๋ณต์กํ ๊ตฌ์กฐ๋ฅผ ํํ, ๊ด๋ฆฌ ๊ฐ๋ฅํจ - ๋งํ(Network) DBMS
- ๊ณ์ธตํ(Hierarchical) DBMS
- ๊ฐ์ฒด๊ด๊ณํ(Object-Relational) DBMS
๋ฐ์ดํฐ๋ฒ ์ด์ค ์ค๊ณ ์ ์ฐจ
์๊ตฌ์ฌํญ ๋ถ์ → ๊ฐ๋
์ ์ค๊ณ → ๋
ผ๋ฆฌ์ ์ค๊ณ → ๋ฌผ๋ฆฌ์ ์ค๊ณ → ๊ตฌํ
SQL(Structured Query Language)
๋ฐ์ดํฐ๋ฒ ์ด์ค์์ ํต์ ์ ์ํด ๊ณ ์๋ ๋ฐ์ดํฐ๋ฒ ์ด์ค ํ๋ถ ์ธ์ด
SQL ๋ช ๋ น์ด
- DDL(Data Definition Language): ๋ฐ์ดํฐ ์ ์์ด
CREATE - DML(Data Manipulation Language): ๋ฐ์ดํฐ ์กฐ์์ด
SELECT, INSERT, UPDATE, DELETE
SQL ์ง๊ณ ํจ์
ํจ์๋ช ์ ํ๋ณ ๊ฐ๋ฅ ์ฌ๋ถ
AVG | ์์นํ |
COUNT | ์์นํ, ๋ฌธ์ํ |
SUM | ์์นํ |
STDDEV | ์์นํ |
MIN | ์์นํ |
MAX | ์์นํ |
RDB์ NoSQL
- RDB - ์ด ๊ธฐ๋ฐ ๊ด๊ณํ
Oracle, MySQL(Oracle), MS-SQL(Microsoft), DB2 · Infomix(IBM), Maria(Sun Microsystems), Derby(Apache), SQLite(์คํ์์ค)- Oracle, DB2 · Infomix(IBM) ๋ฑ์ ์๋ฐํ ๋งํ๋ฉด ๊ฐ์ฒด ๊ด๊ณํ DB๋ก ๊ฐ์ฒด์งํฅ ๊ฐ๋ ์ ๋์ ํ ๊ฒ์ผ๋ก, ์ค๋๋ ์๋ ๋ง์ RDB๊ฐ ์ด๋ฌํ ๊ฐ์ฒด์งํฅ ํ๋ก๊ทธ๋จ์ ํฌํจํ๊ณ ์์
- NoSQL - ๋น๊ด๊ณํ
Document-Oriented DB: CouchDB, MongoDB, Elasticsearch, Cloudant- Key-Value DB: ์๋ง์กด์ Dynamo, Redis, Riak, Conherence, SimpleDB
- Column-Oriented DB: ๊ตฌ๊ธ์ Bigtable, Cassandra, HBase, HyperTable
๋ฐ์ดํฐ ์ถ์ถ ๋ช
๋ น๋ฌธ
select from where _A% : ๋๋ฒ์งธ ๊ธ์๊ฐ A์ธ ๋ฐ์ดํฐ ์ถ์ถ
HAVING: ๊ทธ๋ฃนํจ์(GROUP BY์ )๋ฅผ ์ ์ฉํด ๋์จ ๊ฒฐ๊ณผ๊ฐ ์ค ์ํ๋ ์กฐ๊ฑด์ ๋ถํฉํ๋ ์๋ฃ๋ง ์ฐ์ถํ ๋ ์ฌ์ฉํ๋ ํจ์
๋ฐ์ดํฐ๋ฒ ์ด์ค์ ๊ตฌ์ฑ์์
- ๋ฉํ๋ฐ์ดํฐ(Meta Data): ๋ฐ์ดํฐ์ ๊ดํ ๊ตฌ์กฐํ๋ ๋ฐ์ดํฐ๋ก, ๋ค๋ฅธ ๋ฐ์ดํฐ๋ฅผ ์ค๋ช ํด ์ฃผ๋ ๋ฐ์ดํฐ
- ์ธ๋ฑ์ค(Index): ๋ฐ์ดํฐ๋ฒ ์ด์ค ๋ด์ ๋ฐ์ดํฐ๋ฅผ ์ ์ํ๊ฒ ์ ๋ ฌํ๊ณ ํ์ํ๊ฒ ํด์ฃผ๋ ๊ตฌ์กฐ
๊ฐ์ธ์ ๋ณด ๋น์๋ณ ๊ธฐ์
- ๋ฐ์ดํฐ ๋ง์คํน(Data Masking): ๋ฐ์ดํฐ์ ๊ธธ์ด, ์ ํ, ํ์ ๊ฐ์ ์์ฑ์ ์ ์งํ ์ฑ, ์๋กญ๊ณ ์ฝ๊ธฐ ์ฌ์ด ๋ฐ์ดํฐ๋ฅผ ์ต๋ช ์ผ๋ก ์์ฑํ๋ ๊ธฐ์ (๋ณํ ์ฒ๋ฆฌ)
- ๋ฐ์ดํฐ๊ฐ ์ญ์ (Data Reduction): ๊ฐ์ธ ์ ๋ณด ์๋ณ์ด ๊ฐ๋ฅํ ํน์ ๋ฐ์ดํฐ ๊ฐ ์ญ์ ์ฒ๋ฆฌ
- ๊ฐ๋ช ์ฒ๋ฆฌ(Pseudonymization): ๊ฐ์ธ ์๋ณ์ด ๊ฐ๋ฅํ ๋ฐ์ดํฐ์ ๋ํด ์ง์ ์ ์ผ๋ก ์๋ณํ ์ ์๋ ๋ค๋ฅธ ๊ฐ์ผ๋ก ๋์ฒด
- ๋ฒ์ฃผํ(Data Suppression): ๋จ์ผ ์๋ณ ์ ๋ณด๋ฅผ ํด๋น ๊ทธ๋ฃน์ ๋ํ๊ฐ์ผ๋ก ๋ณํ
- ์ด๊ณ์ฒ๋ฆฌ: ๊ฐ๋ณ ๋ฐ์ดํฐ ๊ฐ์ ์ดํฉ ๋๋ ํ๊ท ๊ฐ์ผ๋ก ๋์ฒดํ๋ ๊ฒ
- ๋์ํ: ํน์ ํ ์์๋ ๊ท์น์ ๊ฐ์ง ์๋ ๋ฌด์์ ์ซ์๋ก ๋ณํ
๊ณ ๊ฐ์ ๊ฐ์ธ์ ๋ณด๊ฐ ๋ฐ์ดํฐ ํด๋ ์ด ๋ถ๊ฐ๋ฅํ ๋์ํ๋ฅผ ํตํด ๋ณ๊ฒฝ๋ ์ฑ๋ก ๊ธฐ์ ์ ์ ์ก๋จ - ์ต๋ช ํ: ๊ฐ์ธ ์๋ณ ์ ๋ณด๋ฅผ ์ญ์ ํ๊ฑฐ๋ ์์๋ณผ ์ ์๋ ํํ๋ก ๋ณํ
ํ๋ก(Hadoop)
๋ถ์ฐ์ฒ๋ฆฌ ์์คํ
์ผ๋ก ๋น
๋ฐ์ดํฐ ํ๋ซํผ ํ๊ฒฝ ๊ตฌ์ถ์ ์ํด ์ฌ์ฉํจ
๋จธ์ ๋ฌ๋
Anaconda: ๋จธ์ ๋ฌ๋ ๊ธฐ๋ฅ์ ๊ฐํํด ์ฃผ๋ ์ํํธ์จ์ด
๋ฅ๋ฌ๋(Deep Learning)
๋ค์ธต ๊ตฌ์กฐ ํํ์ ์ ๊ฒฝ๋ง์ ๋ฐํ์ผ๋ก ํ๋ ๋จธ์ ๋ฌ๋์ ํ ๋ถ์ผ
- ๋ฅ๋ฌ๋ ๋ถ์ ๊ธฐ๋ฒ: CNN, LSTM, Autoencorder
- ๋ฅ๋ฌ๋ ํ์ฉ ์คํ์์ค: Caffe, Tensorflow, Theano
๋ฐ์ดํฐ์์ ๋จ์
๋ฐ์ดํธ(byte), ๋ฉ๊ฐ๋ฐ์ดํธ(MB), ๊ธฐ๊ฐ๋ฐ์ดํธ(GB), ํ ๋ผ๋ฐ์ดํธ(TB)
ํํ๋ฐ์ดํธ(PB), ์์ฌ๋ฐ์ดํธ(EB), ์ ํ๋ฐ์ดํธ(ZB), ์ํ๋ฐ์ดํธ(YB)
B2B ๊ธฐ์ : ๊ธฐ์ ๊ฐ ์ ์์๊ฑฐ๋๋ฅผ ์งํํ์ฌ ์ง์์ ์ธ ๋ฐ์ดํฐ ์์ฑ์ด ์ด๋ ค์
B2C ๊ธฐ์ : ๊ณ ๊ฐ์ ์๋๋ก ํ๊ธฐ ๋๋ฌธ์ ๊ณ ๊ฐ์ ๋ฐ์ดํฐ๊ฐ ์ง์์ ์ผ๋ก ์์ฑ๋จ
<์ถ๊ฐ ์ ๋ฆฌ>
์ถ์ถ: ์ ๋ณด๋ฅผ ์ ๊ณตํ๋ ๋ถ์๊ธฐ์
*๋ถ์๊ธฐ์ : ์ต์ ํ, ๋ชจ๋ธ๋ง, ๊ถ๊ณ , ์๋ฎฌ๋ ์ด์ , ์์ธก ๋ฑ์ ํต์ฐฐ๋ ฅ์ ์ ๊ณตํจ
BI(Business Intelligence): ๋ฐ์ดํฐ ๊ธฐ๋ฐ ์์ฌ๊ฒฐ์ ์ ์ง์ํ๊ธฐ ์ํ ๋ฆฌํฌํธ ์ค์ฌ์ ๋๊ตฌ
- Tableau: BI๋ฅผ ์ํ ์๊ฐ์ ๋ถ์ ์ํํธ์จ์ด
Business Analytics: ์์ฌ๊ฒฐ์ ์ ์ํ ํต๊ณ์ ์ด๊ณ ์ํ์ ์ธ ๋ถ์์ ์ด์ ์ ๋ ๊ธฐ๋ฒ