본문 바로가기

AI 빅데이터73

[자연어 처리] Seq2Seq 로 자연어 번역하기 언어 처리를 위해서는 시계열성이 반영되는 RNN이나 LSTM, GRU등을 사용해왔다. Seq2Seq는 Machine Translation을 위해 구글이 개발한 알고리즘으로 위의 알고리즘을 Encoder와 Decoder로 연결하여 하나의 벡터로 만들어 학습하는 알고리즘이다. 역시 wikidocs.net의 문서가 잘되어 있어 이를 참조했다베꼈다. 위키독스 온라인 책을 제작 공유하는 플랫폼 서비스 wikidocs.net 번역할 문장을 인코딩해서 나온 신경망을 디코더의 입력으로 연결하는 것이다. 'I am a student'의 순서가 나오면 'je suis etudiant'라고 인식하는 것인데, 단어 자체를 분석하여 인식하기보다, 이를 테면 통문장 영어처럼 외워 번역한다고 보면 맞을까? seq2seq은 atte.. 2020. 8. 5.
[자연어처리] 텍스트 생성으로 이해하는 RNN 이미 오래전 기술이지만, 간단한 텍스트 생성 예제를 통해 RNN 활용(!)을 이해해본다. 아래 링크와 전적으로 동일한 것이며, 개인의 이해를 위해 정리해 두는 것 뿐임. 링크를 통해 이해하는 것이 더 확실하다. 위키독스 온라인 책을 제작 공유하는 플랫폼 서비스 wikidocs.net 아래 세 문장으로 학습을 하고, 첫 단어를 입력하면 나머지 문장을 만들어 주는 것이다. 경마장에 있는 말이 뛰고 있다 그의 말이 법이다 가는 말이 고와야 오는 말이 곱다 이전에도 이야기했듯이 수식으로 이해할 생각은 전혀 없고, 활용에만 집중하고 싶다. 위의 그림을 간단히 이해하자면 다음 Step의 결과는 현재의 입력과 직전의 Hidden State가 영향을 준다는 것이다. 얼마나 영향을 주는 지를 나타내는 Weight를 찾아.. 2020. 8. 2.
[GCP] GitLab으로 Jupyter Hub 연결해서 사용하기 지난 포스팅에서 Kubernetes Cluster안에 Jupyter Hub를 설치하고 GitHub Login을 사용하는 것까지 해 보았다. [GCP] GKE에 Jupyter Notebook 운영하고 GitHub로 사용자 관리 Jupyter Notebook은 로컬 환경이나 클라우드 환경에서 VM에 설치하여 많이 이용된다. 기업차원에서 이용한다면 매 사용자마다 노트북을 설치하는 것보다 쿠버네티스 환경에 Jupyter Notebook을 설치하고 magoker.tistory.com 그런데 이렇게 했을 때 문제가 GitHub에 올려 놓은 private git들을 Jupyter Hub에서 가져가려면 ssh 이용 설정을 해야한다는 것인데, 좀 귀찮은 작업이 된다. GitHub와 유사한 GitLab은 Local로 설치.. 2020. 7. 29.
[GCP] GKE에 Jupyter Notebook 운영하고 GitHub로 사용자 관리 Jupyter Notebook은 로컬 환경이나 클라우드 환경에서 VM에 설치하여 많이 이용된다. 기업차원에서 이용한다면 매 사용자마다 노트북을 설치하는 것보다 쿠버네티스 환경에 Jupyter Notebook을 설치하고 여러 사용자가 이를 이용할 수 있다면 효율성을 높일 수 있다. 즉, 쿠버네티스 환경에서 Multi Tenant로 Jupyter Notebook을 이용하게 되는 것이다. Jupyter Notebook은 Multi Tenant를 위해 Jupyter Hub를 개발하였으며, 쿠버네티스 환경에서의 운영을 위해 아래와 같은 가이드도 제공하고 있다. Setup Kubernetes — Zero to JupyterHub with Kubernetes 0.0.1-set.by.chartpress document.. 2020. 7. 29.
[OSS] KNative로 컨테이너 Serverless로 서빙하기 쿠버네티스가 클라우드 관리의 표준이 되어가고 있지만, 쿠버네티스 관리 자체가 부담되기도 하며, 자동으로 컨테이너 로드 관리를 원할 때가 있다. 이를 테면, 소수의 노드를 여러 명이 번갈아 자신의 컨테이너를 사용해야 하는 환경이라면 매번 컨테이너 이미지를 올리거나 scale up/down하는 것이 번거로울 수 있다. 여러 AI 모델들을 올려 놓고 판매하는 장터가 생긴다면, 관리 없이 요청에 의해 각 컨테이너가 로드될 수 있다면 편리할 것이다. 적합한 예시였는지 확신하긴 어렵지만, Serverless는 이와 같이 서버 관리에 신경 쓰지 않고 컨테이너를 이용하기 위해(?, 자신 없음) 만들어졌다. GCP의 Cloud Run이나 AWS Fargate가 이러한 기능을 Managed Service로 구현해 놓은 것.. 2020. 7. 14.
[자연어처리] 간단하게 텍스트 감성 분류하기 CNN으로 SA(Sentimental Analysis)하는 건 김윤박사의 논문으로 유명해졌는데, 비전공자로써 알고리즘 이해하는 건 쉽지 않았다. 간단히 DNN 네트워크를 구성하고 감성분류하는 내용을 Keras로 따라해 보기로 했다. 유명한 아래 책의 4장에 있는 내용을 살짝만 바꿨다. 텐서플로와 머신러닝으로 시작하는 자연어 처리 본 서는 기존 자연어 처리 서적과는 다른 세 가지 특징을 가지고 있다. 첫째, 자연어 처리에 활용되는 개념적인 설명에서 끝나는 것이 아니라 모델 구현에 집중한다. 그뿐만 아니라 상용 서비스� www.yes24.com EDA하는 과정도 자세히 나와 있지만, 후려치는 AI알고리즘이니 데이터 읽기 -> 간단한 전처리 -> 토큰화 -> 임베딩으로 포함한 모델링 -> 테스트 부분으로만 볼.. 2020. 7. 13.