목록Deep Learning/프로젝트 후기 (6)
Patrick's 데이터 세상
올 한 해를 돌아보면 굉장히 많은 일들이 있었던 한 해였습니다.직원용 HR 챗봇 및 AICC 콜봇 리드 개발 및 런칭을 하였고 허깅페이스 관련 서적 집필을 준비하였습니다.또, 개인적으로는 결혼이라는 인생에서 가장 큰 일을 치르기도 했습니다. 한 해 동안 준비하며 이뤄낸 것이 있어 그로 인해 다음 스텝을 준비할 수 있는 것 같습니다.이러한 경험을 돌아보며 배운 점을 정리해 보고자 합니다. 1. 도서 집필 "자연어 처리를 위한 허깅페이스 트랜스포머 하드 트레이닝" 1) 개요허깅페이스를 활용하여 코드와 결과물로 자연어 처리 작업 전반의 기능을 소개하는 도서입니다.코랩 활용법과 허깅페이스 코드를 활용하여 모델 미세조정, 저장, 평가, 추론, 경량화, 강화학습에 대해 소개합니다. 집필 동기: 블로그에 정리된 허..
2023년 6월부터 사내에서 비즈니스 모델로 개발한 모델입니다.MBTI 타입, 마케팅 정보 11개, 소구점을 입력으로 하여 각 정보가 반영된 광고 문구를 생성하는 T5 모델을 이용하여 광고 문구를 생성모델을 구현하는 프로젝트입니다. 예시 👉🏻 작업 환경Google Colab Pro PlusGPU typeA100-SXM4-40GBGPU count4CPU typeIntel Xeon 2.2GhzRAM13GB 👉🏻 DatasetNT, NF, ST, SF 4개 유형 각 1,584건 총 6,336건 데이터 대상으로 마케팅 관련 13개 정보를 input feature로 활용하고 구축된 광고 문구를 output feature로 활용합니다. T5는 Text-to-Text 구조로 디자인하기 위해 input에 fi..
2022년에 사내에서 국내 유통대기업과의 공동 연구로 진행했던 프로젝트입니다.해당 프로젝트에 대해 공동 연구를 진행하고 나서 보유하고 있는 데이터와 논문을 활용하여 모델을 다시 재구현하는 것이 목적이었습니다.MBTI를 ST, NT, SF, NF 총 4개로 분류하여 성격 유형으로 나누고 각각의 문체를 특성으로 하여 시즌 정보와 MBTI 성격 유형을 입력하면 앱푸쉬 광고 문자를 생성하는 모델을 만드는 태스크입니다.예시원문시즌 정보성향모델 생성 광고 문구10월이니까 1OOO포인트♬브랜드별 할인 받고 1천P 적립까지 더! 알뜰하게 가을 옷 준비하려면 터치▶가을맞이SF10월 OOOOO 포인트 혜택 도착♥브랜드별 할인에 1천P 적립까지 다 받아 알뜰하게 쇼핑하자! 👉🏻 참고https://textnet.kr/p..
https://github.com/hipster4020/sentiment_classification GitHub - hipster4020/sentiment_classification: 긍정/부정/중립 3개로 분류하는 classification 모델 with active learn긍정/부정/중립 3개로 분류하는 classification 모델 with active learning - GitHub - hipster4020/sentiment_classification: 긍정/부정/중립 3개로 분류하는 classification 모델 with active learninggithub.com 👉🏻 model Electra with Active Learning 본문 텍스트를 통해 긍정, 중립, 부정으로 분류하..
2022.02.27 - [Deep Learning/NLP(Natural Language Processing)] - Transformer Encoder 카테고리 분류 개발 후기 - 1. Tokenizer Transformer Encoder 카테고리 분류 개발 후기 - 1. Tokenizer그동안 회사에서 작업했던 30개 카테고리 class 분류 모델 개발 과정 및 삽질 과정을 기록하려고 한다. 전체 프로세스에 대한 공유 목적이자 다시 공부하려는 목적이기도 하다. https://github.com/hipstehipster4020.tistory.com Transformer Encoder 카테고리 분류 모델 1부에서 BPE Tokenizer 학습에 대해 정리해보았다.2부에서는 model train 전체 프로..
그동안 회사에서 작업했던 30개 카테고리 class 분류 모델 개발 과정 및 삽질 과정을 기록하려고 한다.전체 프로세스에 대한 공유 목적이자 다시 공부하려는 목적이기도 하다.https://github.com/hipster4020/category_classification GitHub - hipster4020/category_classification: 뉴스 카테고리 분류뉴스 카테고리 분류. Contribute to hipster4020/category_classification development by creating an account on GitHub.github.com 👉🏻 작업 환경 GPU typeNVIDIA GeForce RTX 3090 CPU count48 GPU count4 CUDA V..