ADsP

ADsP 1๊ณผ๋ชฉ 3-3 ๋น…๋ฐ์ดํ„ฐ ๊ทธ๋ฆฌ๊ณ  ๋ฐ์ดํ„ฐ ์‚ฌ์ด์–ธ์Šค์˜ ๋ฏธ๋ž˜ | ์ •๋ฆฌ๐Ÿ“

studyrooom 2024. 9. 2. 17:33
SMALL

3. ๋น…๋ฐ์ดํ„ฐ ๊ทธ๋ฆฌ๊ณ  ๋ฐ์ดํ„ฐ ์‚ฌ์ด์–ธ์Šค์˜ ๋ฏธ๋ž˜

๊ธ‰๋ณ€ํ•˜๋Š” ํ™˜๊ฒฝ์—์„œ ์˜ˆ์ธกํ•˜์ง€ ๋ชปํ–ˆ๋˜ ์ „ํ™˜์ด๋‚˜ ์œ„๊ธฐ์— ๋นจ๋ฆฌ ์ ์‘ํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•  ๊ฒƒ

 

์„œ๋น„ํƒ€์ด์ œ์ด์…˜(Servitization)

  • Service Science์˜ ํ•˜๋‚˜๋กœ ์ œํ’ˆ๊ณผ ์„œ๋น„์Šค์˜ ๊ฒฐํ•ฉ์„ ํ†ตํ•œ ๊ธฐ์—…์˜ ์ƒˆ๋กœ์šด ๋น„์ฆˆ๋‹ˆ์Šค ๋ชจ๋ธ์ž„
  • ์ œํ’ˆ์˜ ์„œ๋น„์Šคํ™”์™€ ์„œ๋น„์Šค์˜ ์ƒํ’ˆํ™”๋ฅผ ๋ชจ๋‘ ํฌํ•จํ•˜๋Š” ๊ฒฐํ•ฉ ๋ชจ๋ธ
  • ํŒŒ์ดํ”„ ๋ผ์ธ ๋น„์ฆˆ๋‹ˆ์Šค๋ฅผ ๋„˜์–ด ํ”Œ๋žซํผ ๋น„์ฆˆ๋‹ˆ์Šค๋ฅผ ์œ„ํ•œ ๋ชจ๋ธ

 

๋ฏธ๋ž˜ ์‚ฌํšŒ์˜ ํŠน์„ฑ๊ณผ ๋น…๋ฐ์ดํ„ฐ์˜ ์—ญํ• 

  • ์œตํ•ฉ — ์ฐฝ์กฐ๋ ฅ
  • ๋ฆฌ์Šคํฌ — ๋Œ€์‘๋ ฅ
  • ๋ถˆํ™•์‹ค์„ฑ — ํ†ต์ฐฐ๋ ฅ
  • ์Šค๋งˆํŠธ — ๊ฒฝ์Ÿ๋ ฅ

๋ฏธ๋ž˜ ๊ฐ€์น˜ ํŒจ๋Ÿฌ๋‹ค์ž„์˜ ๋ณ€ํ™”์—์„œ ๋น…๋ฐ์ดํ„ฐ ๋ถ„์„ ํ™œ์šฉ ๋Šฅ๋ ฅ์€ ํ•ต์‹ฌ์ ์ธ ์—ญํ• ์ž„

๋””์ง€ํ„ธํ™”(Digitalization) → ์—ฐ๊ฒฐ(Connection) → ์—์ด์ „์‹œ(Agency)

๊ธฐ์—…์˜ ๋น…๋ฐ์ดํ„ฐ ๋ถ„์„์€ ๊ธฐ์—…์˜ ๋ถ„์„ ๋ฌธํ™”์— ์˜ํ–ฅ์„ ๋งŽ์ด ๋ฐ›์Œ

 


 

์—ฌ๊ธฐ์„  DBMS์˜ ํŠน์ง•, ๊ฐœ์ธ์ •๋ณด ๋น„์‹๋ณ„ ๊ธฐ์ˆ  ๋‚ด์šฉ์ด ์ค‘์š”ํ•ด์š”
๊ฐ€๋” ๋ฐ์ดํ„ฐ์–‘์˜ ๋‹จ์œ„ ๋ฌธ์ œ๋„ ์ถœ์ œ๋ฉ๋‹ˆ๋‹ค
๋ฌธ์ œ ํ’€๊ณ  ์ •๋ฆฌํ•œ ๋‚ด์šฉ ๋„ฃ์–ด ๋‘” ๊ฑฐ๋ผ ๊ธฐ์ถœ์— ํ•œ ๋ฒˆ์”ฉ์€ ์žˆ๋‹ค๊ณ  ์ƒ๊ฐํ•ด ์ฃผ์„ธ์š”

 

์ตœ์‹  ๋น…๋ฐ์ดํ„ฐ ์ƒ์‹

DBMS(Database Management System)
์‚ฌ์šฉ์ž์™€ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค ์‚ฌ์ด์—์„œ ์‚ฌ์šฉ์ž์˜ ์š”๊ตฌ์— ๋”ฐ๋ผ ์ •๋ณด๋ฅผ ์ฒ˜๋ฆฌํ•ด์ฃผ๊ณ  ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค๋ฅผ ๊ด€๋ฆฌ, ์šด์˜ํ•˜๋Š” ์†Œํ”„ํŠธ์›จ์–ด

  • ์ •์˜, ์กฐ์ž‘, ์ œ์–ด๋ผ๋Š” 3๊ฐ€์ง€ ํ•„์ˆ˜ ๊ธฐ๋Šฅ์ด ์žˆ์Œ
  • ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค์—๋Š” ๋ถ„์„์ด ๋ถˆ๊ฐ€ํ•œ ๋ฐ์ดํ„ฐ๋„ ์žˆ์Œ (์ฒ˜๋ฆฌ ๋“ฑ์„ ํ†ตํ•ด ๋ถ„์„์— ํ™œ์šฉ ๊ฐ€๋Šฅ)
  • DBMS ์†Œํ”„ํŠธ์›จ์–ด๋ฅผ ์‚ฌ์šฉํ•ด ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค๋ฅผ ๊ตฌ์ถ•ํ•˜๊ณ  ์œ ์ง€ํ•จ
  • RDBMS๋Š” ๋ฐ์ดํ„ฐ๋ฅผ 2์ฐจ์› ํ…Œ์ด๋ธ”๋กœ ํ‘œํ˜„ํ•˜์ง€๋งŒ, ๋ชจ๋“  ๋ฐ์ดํ„ฐ๊ฐ€ ์ด๋Ÿฐ ๋ฐฉ์‹์€ ์•„๋‹˜
    NoSQL ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค๋Š” ๋ถ„์„, key-๊ฐ’, ๊ทธ๋ž˜ํ”„ ๋“ฑ ๋‹ค์–‘ํ•œ ๋ฐ์ดํ„ฐ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•จ
  • ๊ด€๊ณ„ํ˜•(Relational)
    DBMS ํ…Œ์ด๋ธ” ๊ธฐ๋ฐ˜์œผ๋กœ ์ผ๋ฐ˜์ ์œผ๋กœ ์‚ฌ์šฉํ•จ
  • ๊ฐ์ฒด์ง€ํ–ฅ(Object-Oriented) DBMS
    ๊ฐ์ฒด ํ˜•ํƒœ๋กœ ๋ณต์žกํ•œ ๊ตฌ์กฐ๋ฅผ ํ‘œํ˜„, ๊ด€๋ฆฌ ๊ฐ€๋Šฅํ•จ
  • ๋งํ˜•(Network) DBMS
  • ๊ณ„์ธตํ˜•(Hierarchical) DBMS
  • ๊ฐ์ฒด๊ด€๊ณ„ํ˜•(Object-Relational) DBMS

๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค ์„ค๊ณ„ ์ ˆ์ฐจ
์š”๊ตฌ์‚ฌํ•ญ ๋ถ„์„ → ๊ฐœ๋…์  ์„ค๊ณ„ → ๋…ผ๋ฆฌ์  ์„ค๊ณ„ → ๋ฌผ๋ฆฌ์  ์„ค๊ณ„ → ๊ตฌํ˜„

 

SQL(Structured Query Language)

๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค์™€์˜ ํ†ต์‹ ์„ ์œ„ํ•ด ๊ณ ์•ˆ๋œ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค ํ•˜๋ถ€ ์–ธ์–ด

 

SQL ๋ช…๋ น์–ด

  • DDL(Data Definition Language): ๋ฐ์ดํ„ฐ ์ •์˜์–ด
    CREATE
  • DML(Data Manipulation Language): ๋ฐ์ดํ„ฐ ์กฐ์ž‘์–ด
    SELECT, INSERT, UPDATE, DELETE

SQL ์ง‘๊ณ„ ํ•จ์ˆ˜

ํ•จ์ˆ˜๋ช… ์œ ํ˜•๋ณ„ ๊ฐ€๋Šฅ ์—ฌ๋ถ€

AVG ์ˆ˜์น˜ํ˜•
COUNT ์ˆ˜์น˜ํ˜•, ๋ฌธ์žํ˜•
SUM ์ˆ˜์น˜ํ˜•
STDDEV ์ˆ˜์น˜ํ˜•
MIN ์ˆ˜์น˜ํ˜•
MAX ์ˆ˜์น˜ํ˜•

 

RDB์™€ NoSQL

  • RDB - ์—ด ๊ธฐ๋ฐ˜ ๊ด€๊ณ„ํ˜•
    Oracle, MySQL(Oracle), MS-SQL(Microsoft), DB2 · Infomix(IBM), Maria(Sun Microsystems), Derby(Apache), SQLite(์˜คํ”ˆ์†Œ์Šค)
    • Oracle, DB2 · Infomix(IBM) ๋“ฑ์€ ์—„๋ฐ€ํžˆ ๋งํ•˜๋ฉด ๊ฐ์ฒด ๊ด€๊ณ„ํ˜• DB๋กœ ๊ฐ์ฒด์ง€ํ–ฅ ๊ฐœ๋…์„ ๋„์ž…ํ•œ ๊ฒƒ์œผ๋กœ, ์˜ค๋Š˜๋‚ ์—๋Š” ๋งŽ์€ RDB๊ฐ€ ์ด๋Ÿฌํ•œ ๊ฐ์ฒด์ง€ํ–ฅ ํ”„๋กœ๊ทธ๋žจ์„ ํฌํ•จํ•˜๊ณ  ์žˆ์Œ
  • NoSQL - ๋น„๊ด€๊ณ„ํ˜•
    Document-Oriented DB: CouchDB, MongoDB, Elasticsearch, Cloudant
    • Key-Value DB: ์•„๋งˆ์กด์˜ Dynamo, Redis, Riak, Conherence, SimpleDB
    • Column-Oriented DB: ๊ตฌ๊ธ€์˜ Bigtable, Cassandra, HBase, HyperTable

 

๋ฐ์ดํ„ฐ ์ถ”์ถœ ๋ช…๋ น๋ฌธ
select from where _A% : ๋‘๋ฒˆ์งธ ๊ธ€์ž๊ฐ€ A์ธ ๋ฐ์ดํ„ฐ ์ถ”์ถœ

 

HAVING: ๊ทธ๋ฃนํ•จ์ˆ˜(GROUP BY์ ˆ)๋ฅผ ์ ์šฉํ•ด ๋‚˜์˜จ ๊ฒฐ๊ณผ๊ฐ’ ์ค‘ ์›ํ•˜๋Š” ์กฐ๊ฑด์— ๋ถ€ํ•ฉํ•˜๋Š” ์ž๋ฃŒ๋งŒ ์‚ฐ์ถœํ•  ๋•Œ ์‚ฌ์šฉํ•˜๋Š” ํ•จ์ˆ˜


๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค์˜ ๊ตฌ์„ฑ์š”์†Œ

  • ๋ฉ”ํƒ€๋ฐ์ดํ„ฐ(Meta Data): ๋ฐ์ดํ„ฐ์— ๊ด€ํ•œ ๊ตฌ์กฐํ™”๋œ ๋ฐ์ดํ„ฐ๋กœ, ๋‹ค๋ฅธ ๋ฐ์ดํ„ฐ๋ฅผ ์„ค๋ช…ํ•ด ์ฃผ๋Š” ๋ฐ์ดํ„ฐ
  • ์ธ๋ฑ์Šค(Index): ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค ๋‚ด์˜ ๋ฐ์ดํ„ฐ๋ฅผ ์‹ ์†ํ•˜๊ฒŒ ์ •๋ ฌํ•˜๊ณ  ํƒ์ƒ‰ํ•˜๊ฒŒ ํ•ด์ฃผ๋Š” ๊ตฌ์กฐ

 

๊ฐœ์ธ์ •๋ณด ๋น„์‹๋ณ„ ๊ธฐ์ˆ 

  • ๋ฐ์ดํ„ฐ ๋งˆ์Šคํ‚น(Data Masking): ๋ฐ์ดํ„ฐ์˜ ๊ธธ์ด, ์œ ํ˜•, ํ˜•์‹ ๊ฐ™์€ ์†์„ฑ์„ ์œ ์ง€ํ•œ ์ฑ„, ์ƒˆ๋กญ๊ณ  ์ฝ๊ธฐ ์‰ฌ์šด ๋ฐ์ดํ„ฐ๋ฅผ ์ต๋ช…์œผ๋กœ ์ƒ์„ฑํ•˜๋Š” ๊ธฐ์ˆ  (๋ณ„ํ‘œ ์ฒ˜๋ฆฌ)
  • ๋ฐ์ดํ„ฐ๊ฐ’ ์‚ญ์ œ(Data Reduction): ๊ฐœ์ธ ์ •๋ณด ์‹๋ณ„์ด ๊ฐ€๋Šฅํ•œ ํŠน์ • ๋ฐ์ดํ„ฐ ๊ฐ’ ์‚ญ์ œ ์ฒ˜๋ฆฌ
  • ๊ฐ€๋ช…์ฒ˜๋ฆฌ(Pseudonymization): ๊ฐœ์ธ ์‹๋ณ„์ด ๊ฐ€๋Šฅํ•œ ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•ด ์ง์ ‘์ ์œผ๋กœ ์‹๋ณ„ํ•  ์ˆ˜ ์—†๋Š” ๋‹ค๋ฅธ ๊ฐ’์œผ๋กœ ๋Œ€์ฒด
  • ๋ฒ”์ฃผํ™”(Data Suppression): ๋‹จ์ผ ์‹๋ณ„ ์ •๋ณด๋ฅผ ํ•ด๋‹น ๊ทธ๋ฃน์˜ ๋Œ€ํ‘œ๊ฐ’์œผ๋กœ ๋ณ€ํ™˜
  • ์ด๊ณ„์ฒ˜๋ฆฌ: ๊ฐœ๋ณ„ ๋ฐ์ดํ„ฐ ๊ฐ’์„ ์ดํ•ฉ ๋˜๋Š” ํ‰๊ท ๊ฐ’์œผ๋กœ ๋Œ€์ฒดํ•˜๋Š” ๊ฒƒ
  • ๋‚œ์ˆ˜ํ™”: ํŠน์ •ํ•œ ์ˆœ์„œ๋‚˜ ๊ทœ์น™์„ ๊ฐ–์ง€ ์•Š๋Š” ๋ฌด์ž‘์œ„ ์ˆซ์ž๋กœ ๋ณ€ํ™˜
    ๊ณ ๊ฐ์˜ ๊ฐœ์ธ์ •๋ณด๊ฐ€ ๋ฐ์ดํ„ฐ ํ•ด๋…์ด ๋ถˆ๊ฐ€๋Šฅํ•œ ๋‚œ์ˆ˜ํ™”๋ฅผ ํ†ตํ•ด ๋ณ€๊ฒฝ๋œ ์ฑ„๋กœ ๊ธฐ์—…์— ์ „์†ก๋จ
  • ์ต๋ช…ํ™”: ๊ฐœ์ธ ์‹๋ณ„ ์ •๋ณด๋ฅผ ์‚ญ์ œํ•˜๊ฑฐ๋‚˜ ์•Œ์•„๋ณผ ์ˆ˜ ์—†๋Š” ํ˜•ํƒœ๋กœ ๋ณ€ํ™˜

ํ•˜๋‘ก(Hadoop)
๋ถ„์‚ฐ์ฒ˜๋ฆฌ ์‹œ์Šคํ…œ์œผ๋กœ ๋น…๋ฐ์ดํ„ฐ ํ”Œ๋žซํผ ํ™˜๊ฒฝ ๊ตฌ์ถ•์„ ์œ„ํ•ด ์‚ฌ์šฉํ•จ

 

๋จธ์‹ ๋Ÿฌ๋‹

Anaconda: ๋จธ์‹ ๋Ÿฌ๋‹ ๊ธฐ๋Šฅ์„ ๊ฐ•ํ™”ํ•ด ์ฃผ๋Š” ์†Œํ”„ํŠธ์›จ์–ด

 

๋”ฅ๋Ÿฌ๋‹(Deep Learning)
๋‹ค์ธต ๊ตฌ์กฐ ํ˜•ํƒœ์˜ ์‹ ๊ฒฝ๋ง์„ ๋ฐ”ํƒ•์œผ๋กœ ํ•˜๋Š” ๋จธ์‹ ๋Ÿฌ๋‹์˜ ํ•œ ๋ถ„์•ผ

  • ๋”ฅ๋Ÿฌ๋‹ ๋ถ„์„ ๊ธฐ๋ฒ•: CNN, LSTM, Autoencorder
  • ๋”ฅ๋Ÿฌ๋‹ ํ™œ์šฉ ์˜คํ”ˆ์†Œ์Šค: Caffe, Tensorflow, Theano

 

๋ฐ์ดํ„ฐ์–‘์˜ ๋‹จ์œ„

๋ฐ”์ดํŠธ(byte), ๋ฉ”๊ฐ€๋ฐ”์ดํŠธ(MB), ๊ธฐ๊ฐ€๋ฐ”์ดํŠธ(GB), ํ…Œ๋ผ๋ฐ”์ดํŠธ(TB)

ํŽ˜ํƒ€๋ฐ”์ดํŠธ(PB), ์—‘์‚ฌ๋ฐ”์ดํŠธ(EB), ์ œํƒ€๋ฐ”์ดํŠธ(ZB), ์š”ํƒ€๋ฐ”์ดํŠธ(YB)

 

B2B ๊ธฐ์—…: ๊ธฐ์—… ๊ฐ„ ์ „์ž์ƒ๊ฑฐ๋ž˜๋ฅผ ์ง„ํ–‰ํ•˜์—ฌ ์ง€์†์ ์ธ ๋ฐ์ดํ„ฐ ์ƒ์„ฑ์ด ์–ด๋ ค์›€

B2C ๊ธฐ์—…: ๊ณ ๊ฐ์„ ์ƒ๋Œ€๋กœ ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ๊ณ ๊ฐ์˜ ๋ฐ์ดํ„ฐ๊ฐ€ ์ง€์†์ ์œผ๋กœ ์ƒ์„ฑ๋จ

 

<์ถ”๊ฐ€ ์ •๋ฆฌ>

์ถ”์ถœ: ์ •๋ณด๋ฅผ ์ œ๊ณตํ•˜๋Š” ๋ถ„์„๊ธฐ์ˆ 

*๋ถ„์„๊ธฐ์ˆ : ์ตœ์ ํ™”, ๋ชจ๋ธ๋ง, ๊ถŒ๊ณ , ์‹œ๋ฎฌ๋ ˆ์ด์…˜, ์˜ˆ์ธก ๋“ฑ์€ ํ†ต์ฐฐ๋ ฅ์„ ์ œ๊ณตํ•จ

 

BI(Business Intelligence): ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ์˜์‚ฌ๊ฒฐ์ •์„ ์ง€์›ํ•˜๊ธฐ ์œ„ํ•œ ๋ฆฌํฌํŠธ ์ค‘์‹ฌ์˜ ๋„๊ตฌ

  • Tableau: BI๋ฅผ ์œ„ํ•œ ์‹œ๊ฐ์  ๋ถ„์„ ์†Œํ”„ํŠธ์›จ์–ด

Business Analytics: ์˜์‚ฌ๊ฒฐ์ •์„ ์œ„ํ•œ ํ†ต๊ณ„์ ์ด๊ณ  ์ˆ˜ํ•™์ ์ธ ๋ถ„์„์— ์ดˆ์ ์„ ๋‘” ๊ธฐ๋ฒ•

๋ฐ˜์‘ํ˜•
LIST