본문 바로가기
  • think normal
새로워지기/서른의 생활코딩

자가동력미션 01. 집에 있는 책들을 데이터 베이스화 하기 1-1)구상/엑셀로 정리하기

by 청춘만화 2019. 3. 18.

자가동력미션 01. 집에 있는 책들을 데이터 베이스화 하기


1. 데이터베이스 구상하기

1-1) 엑셀로 정리하기






봄, 서재를 정리하다가 


문득,

여기에 있는 책들의 분류와 비율을 정리하면 

나는 어떤 사람인가? 에 대한 데이터를 추출할 수 있지 않을까? 하는 호기심이 발동했다.


1.

데이터를 만들어보자!

1-1 

일단 컬럼은 구분, 책이름, 저자, 출판사, 가격, 부제 또는 개요 로 구성해보았다.

1-2

컬럼 선정 기준은

구분은 카테고리 비중으로 개인의 기호를 파악

책이름은 단순히 구분용이 아닌, 키워드 또는 어떤 유형의 카피에 뽐뿌가 오는가를 추정

저자는 빈도가 높은 저자를 통해 개인의 캐릭터를 부여할 수 있지않을까?

가격은 사실, 수량 보다 더 중요한 지표가 될 수도 있다는 추정을 해본다.

부제 또는 개요는 사실 욕심사항이다. 형태소 분석을 해보고 싶다. 반복되는 키워드가 추출되지 않을까 한다.


2.

통계 분석을 하려면 어떠한 형태로든 정리가 되어 있어야한다.

일단 엑셀에 정리해보기로 한다. 다양한 형태? 형식 중에 엑셀만한 툴이 없다.

2-1

뭐.. 처음에는 꼼꼼히 적을 수 있었다. 책을 들춰보며..

2-2

하지만.. 점차 구분이 모호해지기 시작했다. 그래서 타협을 한다. 구분은 교보문고나 알라딘 사이트에서 검색으로 작성하자! 

일단 빨리 적자.

2-3

하지만 매우 많은 시간이 소비되었다. 

책을 펼치고 열고 찾고 책을 내려놓고 컴퓨터에 기록하고.. 

아.. 내는 누구, 지금 여긴 어디..

일단 바로 찾을 수 있는 항목만 기록을 하다가

2-4

이걸 하나하나 쓰고 있는 것이 과연 21세기를 살고 있는 인간의 행동이 맞는가?! 너무 바보같았다. 

결국 책 이름만 기록하기에 이르렀다. 으흐흐.. 사실 꿍꿍이가 있었다.. 

다 기록하고나니 총 437권이다. 

다만, HBR 이나 DBR, 유니타스브랜드, 매거진 B와 같은 간행본은 포함하지 않았다. 

간행본 자체의 컨셉은 명확하지만 각 각의 간행본들이 담고 있는 콘텐츠는 내 선택이 아닌 

발행사에서 섭스크립션한 내용이기 때문에 유의미한 데이터라 볼 수 없다 판단했기 때문이다.





댓글