본문 바로가기

AI 빅데이터73

[자연어분석] Seq2Seq에 Attention 활용하기 RNN 혹은 LSTM과 같은 순차적 모델을 활용해, 언어를 번역하는 것은 아래 포스팅해서 해봤다. [자연어 처리] Seq2Seq 로 자연어 번역하기 언어 처리를 위해서는 시계열성이 반영되는 RNN이나 LSTM, GRU등을 사용해왔다. Seq2Seq는 Machine Translation을 위해 구글이 개발한 알고리즘으로 위의 알고리즘을 Encoder와 Decoder로 연결하여 하나의 벡터 magoker.tistory.com 하지만, 단순히 Seq2Seq를 사용하는 것에는 아래의 문제가 존재한다. 입력 Sequence가 매우 길면, 처음에 나온 Token 정보가 희석된다. Context Vector 사이즈가 고정되어 있어, 긴 Sequence 정보를 담기가 어렵다. 모든 Token이 영향을 주게 되므로, 중.. 2021. 11. 30.
[Apple M1] M1 칩용 Tensorflow 설치 M1 Air를 사고 아래와 같이 삽질하면 Tensorflow를 설치하는 데 까지는 성공했으나, 성능에서 만족은 느낄 수 없었다. [Apple M1] Apple 실리콘용 Tensorflow 실행하기 높으신 분의 은혜로 출시일에 맞춰 주문했고, 오늘 M1 맥북에어를 손에 넣었다(무려 램도 늘려 주셨다). 제일 관심 갔던 것은 아무래도 뉴럴칩으로 머신러닝이 가능하다는 것이었다. Accelerating Ten magoker.tistory.com 한동안 잊고 지내다가 혹시나 공식 발표가 있나 싶어서 검색해보니 Tensorflow 2.5부터는 비교적 쉽게 개발환경을 제공하고 있음을 알 수 있었다. 설치 순서는 아래와 같다. 그저 따라서 설치해보자 1) Xcode Command Line Tool 설치 xcode-se.. 2021. 10. 22.
[GCP] TFX를 Vertex AI에 활용하기 지난번에는 Kubeflow를 활용해 Vertex AI를 구성하는 것을 확인하였다. [GCP] Vertex AI 커스텀 모델 따라하기 21년 Google I/O에서 Machine Learning Platform인 Vertex AI를 출시했다. 기능상으로는 사실 AI Platform과 큰 차이를 모르겠다. 다만 약간 산만했던 AI Platform Pipeline이 좀 더 깔끔해졌고, API들이 고수준으.. magoker.tistory.com Pipeline만 구성해 주고 데이터 준비나 전처리, Serving 등을 직접한다면 위의 내용으로도 충분하겠지만, TFX의 Component들을 이용한다면 얻을 수 있는 이득들이 많이 있다. TFX 컴퍼넌트들의 구성은 아래와 같다. TensorFlow Data Valid.. 2021. 7. 12.
[GCP] AI Platform에서 Pipeline 배포가 되지 않을 때 (수동배포) AI Platform에서 파이프라인을 만들려고 시도했는데, 기본 UI에서 파이프라인이 배포되지 않는다. Cluster까지는 제대로 생성되고, 생성된 클러스터에 Pipeline을 배포하려고 하니, "App Deployment Failed"라는 단순한 메시지만 출력시키고 아무것도 되지 않았다. 인터넷에서 Deployment Manager API를 설치하라느니, Resource Manager API를 설치하라느니 얘기가 있었지만, 수동으로 배포하는 길을 택했다. gcloud config set compute/region us-central1 gcloud config set compute/zone us-central1-a # cluster-1은 gcp에서 생성한 cluster name gcloud contain.. 2021. 7. 9.
[GCP] Vertex AI 커스텀 모델 따라하기 21년 Google I/O에서 Machine Learning Platform인 Vertex AI를 출시했다. 기능상으로는 사실 AI Platform과 큰 차이를 모르겠다. 다만 약간 산만했던 AI Platform Pipeline이 좀 더 깔끔해졌고, API들이 고수준으로 바뀜에 따라 사용이 쉬워진 듯 하다. 차이점은 여기에 있지만, 사실 이제부터는 Vertex AI만 알면 될 것 같다. 예제는 미디움에 있는 아래 포스팅을 이용했다. Serverless Machine Learning Pipelines with Vertex AI: An Introduction There is this big problem for Data Scientists and ML Engineers that work at small co.. 2021. 6. 11.
[이상탐지] Exponential Smoothing을 활용한 이상탐지 시계열 예측 기법 (ARIMA)을 이용하거나, 최근에는 LSTM이나 AutoEncoder 등을 활용한 딥러닝 기반 방법론을 통해 시계열 데이터에서 이상탐지가 가능하다. 딥러닝 계열의 이상탐지가 성능이 우수하다고 일반적으로 알려 있으나, 1) 충분한 데이터 확보가 어렵고(매출이나 날씨 데이터는 기껏해야 하루 단위로 확보 가능하고, 그나마도 계절성을 고려하면 수십년을 모아야하는 경우도 있다), Supervised Learning은 정답 세트를 필요로 한다. 지수 평활법(Exponential Smoothing)은 ARIMA와 유사하게, Trend, Level, Seasonality를 활용하지만, 최근의 결과값에 더 무게를 준다거나 줄일 수 있다는 점이 다르다. 지수평활법은 단순히 Trend와 Level만 참조.. 2021. 2. 14.