파이썬으로 엑셀 데이터를 추출해서 문서로

저장하기 위해선 일차적으로 좀 다듬어야 합니다.


매일 하는 작업인데 누군가에겐 도움이 될 것 

같아 블로그에도 남깁니다.


주소에 포함된 괄호 안의 숫자를 삭제하고,

주소에서 시,구,동을 추출하는 방법입니다.

엑셀 처음 다루는 분의 입장에서 아주 쉽게

스크린샷으로 설명합니다.



ㅁ엑셀 괄호 안 삭제 방법


간단한 예제를 보면서 진행합니다. 


예시파일 시작


주소 괄호안에( )행정구역이 표시되어 있습니다.

괄호 안 숫자를 일괄 삭제하는 방법은 간단합니다.


1.[찾기 및 선택] 클릭


스샷2



엑셀 상단 1시 방향 망원경 모양의

[찾기 및 선택]을 클릭합니다.



2.[바꾸기]에 (*)입력


스샷3


위와 같이 찾을 내용에 (*)을 입력하고

바꿀 내용은 비워둡니다.

쉬프트키 누르고 숫자키 8번을 누르면 됩니다.



3.[모두 바꾸기] 클릭


스샷4



찾기 및 바꾸기 창에서 [모두 바꾸기] 기능을

클릭하면 끝납니다.


스샷6


깔끔하게 괄호안의 숫자들이 일괄 삭제되었습니다.

이제 다음 작업으로 넘어갑니다.





ㅁ엑셀 주소에서 시/구 추출하기


주소를 추출하기 위해선 함수를 사용해야 합니다.

함수라니 뭔가 거북하지만 걱정하지 마세요.

따라오면 누구나 쉽게 할 수 있습니다.


1.기본 작업 


스샷7


엑셀에 시/구를 입력해줍니다.

[C2]셀에 시,[D2]셀에 구를 입렵합니다.


새로 만들어놓은 저 공간에 주소를 추출해서 자동으로 

채워넣어 봅시다.


2.엑셀 주소에서 시 추출하는 방법


이제 함수를 써야 합니다. 

함수라니 뭔가 고오급 스럽습니다. 

막상 해보면 아무것도 아닙니다.


방금 만든 [C2]셀을 클릭합니다.

"시"라고 입력한 바로 아래 셀을 클릭.


이제 함수를 써먹어봅니다.


스샷8



엑셀 상단에 보면 [수식] 메뉴가 있습니다.

클릭해보면 좌측에 [Fx 함수삽입] 메뉴가 보입니다.

과감하게 클릭합니다.


스샷9



함수 마법사 창이 뜨면 [범주선택] 에서

[텍스트]를 선택합니다.


스샷10


텍스트 함수 선택에서 [LEFT] 함수를 선택 후

확인을 눌러줍니다.


이제 함수 인수를 입력해줍니다.

쫄지 말고 따라서 차분히 입력해봅시다.


스샷11


위에 제가 입력한 것과 똑같이 입력합니다.


  함수 인수창에서 Text > B2


주소 입력되어 있는 B2셀을 지정해줍니다.

마우스로 [B2] 셀을 클릭하면 됩니다.


  Num_chars > FIND("시",B2)


B2셀에서 "시"라는 글자를 추출하라고 입력

했으니 확인을 지그시 눌러줍니다.


스샷12



오옷 ! [C2] 셀에 추출한 시가 입력되어 있습니다.

텍스트 함수만 알아도 정말 유용합니다.

이제 동일한 과정으로 주소에서 구를 추출해봅니다.



3.엑셀 주소에서 구 추출하는 방법


스샷13



처음에 만들어둔 구가 들어갈 [D2]셀 선택합니다.

한번 해봤으니 자신감 있게 함수삽입을 클릭


스샷14



텍스트 함수 중 이번엔 MID를 써먹습니다.

함수 선택에서 주욱 내려오다보면 MID 나옵니다.


스샷15



위와 동일하게 함수 인수창에 입력해줍니다.


  Text > B2

  Start_num > LEN(C2)+1

  Num_chars > FIND("구",B2)-LEN(C2)


Text 인수는 아까처럼 주소 입력된 [B2]셀 클릭


Start_numdms "시" 옆에 이어지는 구를 추출

하려는 것이니 C2셀의 글자 길이에 1을 더하라고

LEN함수를 입력합니다.

LEN함수는 계속 다룰 예정이니 그때 추가 설명합니다.


스샷16


정확하게 입력해야 합니다.

확인을 클릭하면 B2셀의 주소에서 구가 추출됩니다.


이제 남은 셀에 수식을 복사해서 자동으로 채워봅니다.


스샷17



[C2] ,[D2]셀을 드래그해서 지정해줍니다.

이제 채우기 기능을 활용합니다.

[C2] ,[D2]셀을 지정 하고 마우스를 우측

모서리 지점에 갖다대면 마우스 포인터가

얇은 + 바뀝니다. 

바뀌면 더블클릭하면 나머지 셀에 자동으로

수식이 적용되면서 시/구가 추출됩니다.


스샷18

이렇게 TEXT함수를 활용하면 주소에서 시/구는

물론 동과 번지수도 쉽게 추출할 수 있습니다.




텍스트 함수는 앞으로 종류별로 활용방법을

다 정리해 올릴 예정입니다.


+


나이드니 많은 것들이 편해집니다.

마음이 너그러워졌는지 이해하게 되고 화도

셀프로 다스리니 생활이 편안합니다.


조바심 낼 일도 없고 인생이 편해졌지만 하루 

두어시간은 답답하고 열불이 나면서도 희열을 느낍니다.

그게 뭐냐면 프로그래밍을 배우는 일입니다.


1.시계열데이터를 수집한다.

2.데이터에서 원하는 값만 추출한다.

3.미리 만들어둔 문서 양식에 맞게 채워 넣는다.

4.데이터베이스에 규칙대로 저장한다.

5.1~4를 반복


5번 과정까지는 누구나 도달할 수 있습니다.

그러나 데이터를 쌓는게 목적이 아닙니다.

곳간을 채워놨으니 분석해서 +@를 만들어야 합니다.


5번까지도 만만치 않은데 R을 활용해 금융공학 

영역으로 넘어가면 헐...


시계열데이터 분석이라 하니 괜시리 뭔가 

있어보이지만 그냥 내가 모르고 지나치는 하루,

일상속에서 기회를 찾아내려는 과정입니다.


저는 KOSPI지수 같은게 아닌 일상속에서 찾아

내려고 하기에 더 만만치 않습니다.


프로그래밍 놓은지 20년 지난 아재가 해내면

누구나 할 수 있다는 생각이 들어 그 과정을

기록해두고 있습니다. 그날이 오기를 !



Posted by 시냅스
: