본문 바로가기

분류 전체보기328

[데이터분석] 주택가격 예측 Kaggle 도전기 오랜만 아니 거의 처음으로 진지하게 캐글 문제를 풀어보기로.. 쉬어보이는 주택 가격 예측을 선택하였다. House Prices: Advanced Regression Techniques Predict sales prices and practice feature engineering, RFs, and gradient boosting www.kaggle.com 집에 관한 여러 약 80가지의 항목이 있고, 그 내용들을 학습하여 test set에 있는 주택 가격을 예측하는 것이다. 1) 간단한 전처리만으로 도전 데이터를 살펴보면, 대체로 항목별로 구분되지만 일부는 continuous 형태의 데이터로 되어 있다. 회귀 분류에는 이런 특성이 도움되지 않을 것 같아 항목별로 데이터 종류가 10~20개 정도로 줄어들 수.. 2020. 9. 25.
[데이터분석] GAN으로 수치 데이터 생성하기 GAN으로 유사한 이미지를 얻어내는 방법들은 많이 나와 있다. 수치 정형데이터도 GAN으로 새로 생성해 낼 수 있는데, 아래의 블로그를 참조하였다. How to Develop a 1D Generative Adversarial Network From Scratch in Keras Generative Adversarial Networks, or GANs for short, are a deep learning architecture for training powerful generator models. A generator model is capable of generating new artificial samples that plausibly could have come from an existing dis.. 2020. 9. 17.
[데이터분석] 시계열 분석 3 - 딥러닝 (LSTM) 시계열 분석을 하는 데 있어 전통적 방법인 ARIMA와 최근에 많이 이용되는 XGBoost를 활용하는 방법을 보았다. 아래 ARIMA 포스팅의 Kaggle Data를 사용한다. [데이터분석] 시계열 분석 - ARIMA 기업 내 데이터분석이 많아지면서 자연스럽게 시계열분석에 대한 Needs가 많아졌다. 마케팅/구매/SCM 등 가치 사슬 내 거의 모든 부분이 시계열 데이터에 의존하고 있는데, 기존의 통계적 접근에�� magoker.tistory.com [데이터분석] 시계열분석 - XGBoost 이전 포스팅에서는 상점 매출 데이터를 ARIMA로 분석하여 예측하는 것을 해 보았다. [데이터분석] 시계열 분석 - ARIMA 기업 내 데이터분석이 많아지면서 자연스럽게 시계열분석에 대한 Needs가 많아 magoke.. 2020. 9. 10.
[데이터분석] 시계열분석 2 - XGBoost 이전 포스팅에서는 상점 매출 데이터를 ARIMA로 분석하여 예측하는 것을 해 보았다. [데이터분석] 시계열 분석 - ARIMA 기업 내 데이터분석이 많아지면서 자연스럽게 시계열분석에 대한 Needs가 많아졌다. 마케팅/구매/SCM 등 가치 사슬 내 거의 모든 부분이 시계열 데이터에 의존하고 있는데, 기존의 통계적 접근에�� magoker.tistory.com 이번에는 같은 데이터를 XGBoost로 분석/예측해본다. XGBoost는 수치형 데이터 분석에서는 현재 거의 끝판왕과 같다. H2O나 DataRobot을 통해 Auto ML을 수행하면 최적 모델이 거의 XGBoost나 같은 계열인 LightGBM으로 선정된다. 여러 모델을 돌려 평균치를 가져오는 Bagging방식의 Random Forest와 달리, .. 2020. 9. 10.
[데이터분석] 시계열 분석 1 - ARIMA 기업 내 데이터분석이 많아지면서 자연스럽게 시계열분석에 대한 Needs가 많아졌다. 마케팅/구매/SCM 등 가치 사슬 내 거의 모든 부분이 시계열 데이터에 의존하고 있는데, 기존의 통계적 접근에서 빅데이터 분석, 딥러닝까지 발전(?)해 오고 있다. Kaggle의 예제 데이터 기반으로 그 방법들을 살펴 볼 예정이다. 데이터는 아래 Kaggle 에서 가져올 수 있다. Store Item Demand Forecasting Challenge Predict 3 months of item sales at different stores www.kaggle.com 구조는 간단해서, 2013년부터 17년말까지 가게(store)별로 각 아이템들이 얼마나 팔렸는지를 나타내고 있다. 월별로 살펴보면 판매는 여름에 높아지고 겨.. 2020. 9. 9.
[태백] 하이원팰리스호텔, 태백고생대자연사박물관, 바람의 언덕 이번 휴가 마지막날의 계획은 구와우해바라기마을, 검룡소, 바람의 언덕이었다. 구와우마을은 이번 폭우로 해바라기의 흔적이 없어졌고, 오전 내내 비가 그치지지 않아 검룡소 트레킹도 접어두었다. ㅠ 서울로 일찍 돌아올까 하다가, 실내에서 볼 수 있는 것이라도 보자고 고생대 자연사박물관을 끼워 넣었다. 경치 좋은 울트라 가성비 호텔 '하이원 팰리스' 우리가 3일간 머무른 곳은 해발 1,100미터에 위치한 하이원팰리스 호텔이다. 성수기인데도 가격이 너무 저렴(9만원/1박)해서 어느 정도 불편할 거라 생각하고 갔는데, 상당히 쾌적할 뿐더러 방도 넓고, 부대시설의 가격도 부담스럽지 않았다. 게다가 고지에 있어 산봉우리들이 너무 아릅다웠고, 골프장의 전경도 호텔에서 바라볼 수 있어 좋다. 방역도 불편할 정도로 꽤 철저.. 2020. 8. 20.