본문 바로가기

분류 전체보기347

[Python] jdbc로 Database(Oracle) 접근하기 데이터 분석을 하다보면 당연히 다양한 데이터 소스에 접근하게됩니다. 파일, 엑셀, 그리고 데이터베이스 까지... 이번에는 JDBC 로 데이터를 가져온 후 하여 pandas의 Dataframe로 변경해보았습니다. import os import sys import jpype import jaydebeapi as jp import pandas.io.sql as pd_sql from pandas import DataFrame # JAVA_HOME이 설정되어 있지 않을 경우 if("JAVA_HOME" not in os.environ): os.environ["JAVA_HOME"] = "[JAVA_HOME path]" # oracle jdbc 파일 경로 및 class 경로 설정 JDBC_Driver = '[jdbc .. 2015. 12. 3.
Python : 다중 회귀 분석 심심해서 해보는 틈틈이 Python으로 하는 통계 분석을 정리해볼까 한다. 첫번째는 다중회귀분석을 아래와 같이 수행했다. 데이터는 아래의 주소를 참조했다. http://college.cengage.com/mathematics/brase/understandable_statistics/7e/students/datasets/mlr/frames/frame.html Data for multiple linear regression college.cengage.com import pandas as pd import statsmodels.formula.api as sm from statsmodels.sandbox.regression.predstd import wls_prediction_std # csv 파일을 가져옴 .. 2015. 12. 2.
도서 : 2015년 하반기 구매 도서 러닝 스파크국내도서저자 : 홀든 카로(Holden Karau),앤디 콘빈스키(Andy Konwinski),패트릭 웬델(Patrick Wendell),마테이 자하리아(Matei Zaharia) / 박종영역출판 : 제이펍 2015.10.15상세보기 뭐.. 스파크에 관심있다보니 구매! 얼마전 페이스 북에서 이벤트로 3명 추첨해서 주신다고 도전했으나 아쉽게도 탈락했다 어차피 살려고 했던 책이라 흠흠... 논쟁거리로 배우는 통계학국내도서저자 : David S.Moore / 심규박역출판 : 홍릉과학(홍릉과학출판사) 2009.09.01상세보기 고감자님 블로그 보다가 추천하시길래 냉큼 구매 나도 이쪽 관련 일을 하다보니 말씀하신대로 틈틈히 정독해볼려고 한다. 2015. 11. 13.
Python : Numpy Intall 하기 삽질삽질... 프로젝트도 끝나서 이제 다시 공부 할려고 하는데 이것저것 다시 셋팅하다보니 Numpy가 필요하네. 설치법 까먹음.... ㅠㅠ Spark의 pyspark에서도 쓸 일이 있고 해서 다시 정리합니다 실행 경로는 [Python 설치폴더]\Lib\site-packages 입니다. 첫번째는 아래와 같이 간단하게 설치 가능 python pip install numpy 두번째는 해당 패키지를 다운 받은 후에 설치(Download 주소 : http://www.lfd.uci.edu/~gohlke/pythonlibs/#numpy) 본인은 위의 방법이 안되서 이 방법으로 설치 했다. python pip install numpy-1.9.3+mkl-cp27-none-win32.whl 참고로 python packag.. 2015. 11. 2.
넋두리 : 잡담 밑의 애들은 알겠지만 매번 강조했던것이 하향 평준화가 될것이다.그것도 그냥 되는 것이 아니라 매우 가속화 될 것이다. 서로가 일을 미루고 열심히 하지 않으며 책임소재 때문에 나서서 하지 않고 학습하고자 하는 의지가 없어지므로 일을 하는 사람들에게만 일이 가중 될 것이다. 그러면 일을 하던 사람 또한 병신이 되거나 병신이 되지 않기 위해 나갈것이다. 근데 그게 예언이 됐네 'ㅅ')a내년이 피크겠구만 2015. 10. 20.
Spotfire & Python : 특정일자를 Input Field에 설정하기 Spotfire에서는 Text Area를 활용해서 다양한 필터를 생성하여 조회 조건으로 사용할 수 있다. Input Field를 사용해서 특정 값을 입력 받을 수 있는데 예를 들면 날짜 같은 것을 말한다. 다만 아쉽지만 Default 값을 설정할 수 가 없으므로 가끔 버튼을 통해 특정일자를 입력하도록 할 수 있다. (물론 Trick을 이용하면 Default값을 줄 수 도 있다) import datetime from datetime import timedelta today = datetime.datetime.now() # 월 이동 계산 함수 def addMonth(date, num): return datetime.datetime(date.year + ((date.month + num)/12), (date... 2015. 8. 30.
Spotfire & Python : 특정값이 일치할 때 해당 행의 다른 값을 가져오기 아따 제목 어렵다. Join할 수도 없고 Relation을 할수도 없는데 주어진 특정값에 일치하는 행이 있다면 그 행의 특정 값을 가져오는 예제. 스샷은 귀찮아서 소스만 올립네다. from Spotfire.Dxp.Data import * table = Document.Data.Tables["Baseball"] keyColumn = table.Columns["팀명"] tarColumn = table.Columns["선수명"] result = "" for i in range(0, table.RowCount): if keyColumn.RowValues.GetValue(i).ValidValue == Document.Properties["test"]: if result == "": result = tarColum.. 2015. 8. 20.
Spotfire & Python : Marking 한 값을 가져오기 Spotfire에서 Marking은 다양한 용도로 사용되며 Spotfire를 특색있게 만드는 중요한 기능 중 하나입니다. 특히 Marking을 통해 선택한 행을 기준으로 시각화 차트의 조건으로 부여한다던지 다양한 시각화차트간의 연관관계를 시각적으로 확인할 수 있도록 구성할 수 있습니다. 다만 정형보고서를 만들다보면 아쉬운게 Marking 된 행의 특정 칼럼 값을 가져오고 싶을 때가 있는데 기본적으로는 지원하지 않는 기능입니다. (Spotfire 6.5 기준). 다행이라면 Ironpython의 도움을 받아서 구현이 가능합니다. 아래의 예제는 Baseball 데이터를 이용하여 Marking한 행의 칼럼 "선수명"의 값을 을 가져오는 예제입니다. (참조 : http://easyspotfire.blogspot... 2015. 8. 20.
로지텍 K480 기존에 가지고있던 블루투스 키보드는 가볍긴한데 키가 너무 붙어 있어서 키 입력이 불편하다. 그래서 고민 끝에 K480 을 질렀다 ㅎㅎㅎㅎㅎ 결론은 짱좋다 ㅋ 노트북용으로도 쓸 수있고 휴대폰, 아이패드 용으로도 만점 좌측 컨트롤러를 활용하여 3가지 기기를 선택할 수 있으며 상단의 홈에 기기를 꽂아 고정할 수 있다. 키감도 나쁘지 않다. 꽤 좋은 편.. 숫자키를 잘쓰는 내겐 숫자키는 아쉽지만 그건 일반 키보드로 충분 ㅎㅎㅎ 다만 아쉬운 점은 꽤 무거운 편인데 아이패드 2를 쓰고 있는지라 두개를 같이 들고 다니기엔 왠만한 노트북 저리가라 수준의 무게인지라... 집에서 서브로 쓸려면 나쁘지 않은거 같다 하지만 외부 활동에 사용하기에는 무게가 제약으로 고려해야할 대상이다. 2015. 8. 12.
일상 : 덥다보니.. 보통 작은방에서 이것저것 작업하거나 공부하는데 요즘 날이 너무 더워서 작은방에서 뭔가 하는게 힘들다... 그래서 이래저래 고민한 끝에 아이패드에 ssh 앱을깔아서 쾌적한 큰방에서 공부를 하고있다..... 이러다보니 아예 블루투스 키보드 하나 살까봐 ㅎㅎ 2015. 8. 5.