전문지식 함양/TIL

[프로그래머스 겨울방학 인공지능 과정] Transformer 이론 기초

샤프펜슬s 2022. 2. 21. 21:23

자연어처리 8주차 이론

기계번역 이론¶

1. RNN(Recurrent Neural Network¶

RNN은 시퀀스의 길이와 관계없이 입력을 받아들일 수 있는 네트워크 구조
RNN은 다양한 아키텍처를 가질 수 있다.
- one to one ~ many to many
RNN의 한계 : 토큰 사이의 거리가 먼 경우 연속적인 정보가 잘 전달되지 않을 수 있음

2. LSTM¶

핵심 아이디어 Gate
- Forget gate : 정보를 잊게 만드는 gate
- Input gate : 새로운 정보를 장기기억에 반영하는 역할
- Cell state : forget gate와 input gate를 이용하여 업데이트하는 일종의 장기기억
- output gate : 장기기억과 현재의 데이터를 이용해 단기기억(hidden state) 갱신

전통적 RNN 기반 번역 과정¶

전통적 RNN기반 기계 번역은 입력과 출력의 크기가 같다고 가정
인코더를 거쳐 context vector(문맥벡터)로 압축하여 추출한 후 디코더가 번역결과를 추론하는 방식을 사용한다.

Transformer¶

1. 딥러닝 기반 기계번역 발전 과정¶

2021년 기준으로 최신 고성능 모델들은 Transformer 아키텍처를 기반으로 운영됨.
RNN의 한계 : context vector에 소스문장 정보를 압축하는 과정에서 병목현상이 발생, 성능 하락의 원인이 된다.
한계점 극복 방안 : 디코더가 context vector를 매번 참고할 수 있도록 구조를 변경
- 다만, 여전히 context vector에 소스 문장을 압축해야 한다는 단점이 존재

1.1. Seq2Seq with Attention¶

Seq2Seq 모델에 어텐션 매커니즘 사용
- 디코더는 인코더의 모든 출력(outputs)을 참고한다
- 디코더는 매번 인코더의 모든 출력 중 어떤 정보가 중요한지를 계산
- 어텐션 가중치를 사용해 각 출력이 어떤 입력 정보를 참고했는지 알 수 있음

2. Transformer¶

트랜스포머는 RNN이나 CNN을 전혀 사용하지 않음
- 바로 인코딩을 진행하여 위치정보를 알려주기 때문에, 순서를 알려주는 RNN을 사용할 필요가 없어진다.
- 대신 Positional Encoding을 사용
BERT와 같은 향상된 네트워크에서도 채택되고 있음
인코더와 디코더로 구성되며, Attention 과정을 여러 레이어에서 반복
- 인코더와 디코더를 다수 사용하게 됨

'전문지식 함양 > TIL' 카테고리의 다른 글

[Microsoft Excel] 엑셀 매크로 작성1 (0)	2023.04.21
[프로그래머스 겨울방학 인공지능 과정] Transformer 이론 기초 (0)	2022.02.22
[프로그래머스 겨울방학 인공지능 과정] Neural Image Caption 이론 (0)	2022.02.20
[프로그래머스 겨울방학 인공지능 과정] Sequence to Sequence Learning with Neural Networks - 이론 (0)	2022.02.20
[프로그래머스 겨울방학 인공지능 과정] CNN을 활용한 풍경 이미지 분류 실습1 (0)	2022.02.17

현재글[프로그래머스 겨울방학 인공지능 과정] Transformer 이론 기초

안녕하세요, 샤프펜슬s입니다. 포스팅된 글에 대한 비판 및 충고, 질문 혹은 기타 하실 말씀이 있으시다면 "ysjin0715@naver.com"으로 연락주시면 감사하겠습니다. 이메일 확인이 늦다보니 답신이 늦을 수도 있는 점 양해부탁드립니다.

마케팅전략, 경영전략, 신문스크랩, 아이다호 대학, 러시아, 게임, 텍스트데이터분석, 시사교양, 수학 보고서, 우크라이나, 감상평, 대학수업, Til, 트렌드, 조직과환경, 캐나다, 미래전략, University of Idaho, 인사전략, 수학보고서,

Today :
Yesterday :

일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

샤프펜슬이 끄적이는 생각공간

[프로그래머스 겨울방학 인공지능 과정] Transformer 이론 기초

기계번역 이론¶

1. RNN(Recurrent Neural Network¶

2. LSTM¶

전통적 RNN 기반 번역 과정¶

Transformer¶

1. 딥러닝 기반 기계번역 발전 과정¶

1.1. Seq2Seq with Attention¶

2. Transformer¶

'전문지식 함양 > TIL' 카테고리의 다른 글

'전문지식 함양/TIL'의 다른글

티스토리툴바

[프로그래머스 겨울방학 인공지능 과정] Transformer 이론 기초

기계번역 이론¶

1. RNN(Recurrent Neural Network¶

2. LSTM¶

전통적 RNN 기반 번역 과정¶

Transformer¶

1. 딥러닝 기반 기계번역 발전 과정¶

1.1. Seq2Seq with Attention¶

2. Transformer¶

'전문지식 함양 > TIL' 카테고리의 다른 글

'전문지식 함양/TIL'의 다른글

관련글

티스토리툴바