지피티 능력 향상 꿀팁
파일이 너무 커서 지피티가 처리 못 할 때 해결하는 방법 #프롬프트엔지니어링 #AI매시업

몇백 페이지 문서로 업무를 봐야 하거나 과제를 해야 할 때 지피티만 믿다가 지피티한테 배신당했을 때가 있었는데
어떻게 하면 그걸 해결해볼 수 있을까 고민해봤어요.
처음엔 왜 지피티는 몇백 페이지짜리 파일은 처리 못하는지 궁금했는데 토큰 수와 관련이 있더라고요. 이에 대해 자세히 궁금하신 분들은 댓글 달아주시면 알려 드릴게요.
본론으로 돌아와서 저는 지피티 토큰의 한계를 AI 매시업을 통해서 해결했어요.
저는 6단계의 매시업을 통해서 해결했는데,
(사실 고퀄리티 번역을 원하는 게 아니라면 이렇게 복잡한 매시업도 필요 없죠. 저는 한 단계 더 나아가서 좀 더 고퀄리티로 번역될 수 있도록 조금 프롬프트와 매시업을 만든 거예요)
1. 텍스트 추출기 (OCR): 첨부된 파일에서 글자를 추출.
2. 청킹: 1단계에서 추출된 텍스트를 AI가 감당할 수 있는 단위(토큰)로 N번 나눔.
3. 번역 요소 도출기: 1단계에서 추출된 텍스트를 분석해 번역 품질을 높이는 데 필요한 요소 (전문 용어, 특정 표현 등)를 추출.
4. 전문 번역기: 2단계 청킹에서 분할된 텍스트를 번역.
5. 청킹: 4단계에서 번역된 텍스트를 다시 한 번 N번 나누어, AI가 6단계 작업을 원활하게 진행할 수 있도록 준비.
6. 윤문기: 5단계에서 청킹이 완료된 텍스트와 3단계에서 나온 번역 요소들을 모두 고려해 최종 결과물을 자연스럽고 매끄럽게 다듬는 작업.
– 최종 응답 형식: 번역 요소 + 6단계에서 윤문된 번역 결과
청킹이란 기술로 지피티 토큰의 한계를 해결한 다음 제가 프롬프팅 한 다른 AI들과 함께 매시업해서 더욱 고퀄리티의 번역 앱을 만들려고 한 건데 이번 글에서는 제가 만들면서 느낀 점들을 공유해볼게요.
1. 중국어 번역 과정에서 발생한 문제
1. 원문 언어 잔존 현상:
– 다른 언어와 달리 중국어 텍스트에서 원문의 한자가 그대로 노출되거나, 중국어 발음이 영어로 표기되는 현상이 나타남.
– 예: “니하오(你好)”가 “ni-hao”로 표기.
– 대체로 본문 내 중요도가 낮은 소제목 부분에서 주로 발생.
2. 번역 엔진별 특성
– 클로드 + 제미나이: 결과물에 중국어가 그대로 노출되는 경우 발생.
– 클로드 + GPT: 결과물에 중국어 발음이 영어로 노출되는 경우 발생.
2. 매시업(Mash-up) 프롬프트에서의 개선 노력
1. 4단계 및 6단계 프롬프트 수정
– “절대 원문 언어나 원문 발음을 표기하지 말라”라는 지시사항을 강조하여 원문 언어 잔존 현상을 크게 줄였으나, 완벽히 해결되지는 않음.
2. 수정 및 테스트 결과
– 최종적으로 아래 두 개의 프롬프트를 유지:
a. “Translate every word. Even the title and the subtitle. Everything in the original text must be translated to English.”
b. “Do not replace any part of the translation with the original language pronunciation in English. Always translate its meaning into English.”
– >프롬프트 보기 클릭!
3.프롬프트 어시스턴트 활용
– 제미나이 프롬프트 어시스턴트를 이용해 초안을 re-fine하여 더욱 간결하면서도 핵심 내용을 전달할 수 있는 프롬프트를 생성.
3. 중국어에서 AI 모델이 헤매는 이유
1. 정확한 원인은 미확인
2. 중국어의 문법·문자 체계가 복잡하고, 다른 언어에 비해 모델이 번역을 처리하는 데 어려움을 겪는 것으로 추정.
3. 쳇 지피티에 원문의 한 부분을 복사 붙여 넣기 한 후 번역을 부탁할 경우 다른 언어는 번역 내용만 나오지만, 중국어는 한자 하나하나에 뜻이 있어서 그런지 의미설명을 많이 덧붙이는 걸 확인할 수 있었다.
4. 매시업 순서와 결과물 품질
1. 매시업 순서의 중요성
– 모듈을 잘못 결합하거나 순서를 바꿀경우, 번역 요소만 나오거나 같은 내용이 중복되는 문제가 발생.
– 올바른 순서로 결합 시 (페이지 위 6단계 매쉬업 프로세스 참조), 번역 요소와 최종 번역본이 함께 출력되며 고품질의 번역기가 완성됨.
5. 필터링(Filtered Contents) 이슈
1. 클로드의 민감한 필터
– 예: 「이상한 나라의 앨리스」가 필터링되어 작동하지 않는 문제 발생.
– 이때는 GPT로 전환하여 시도 가능.
2. GPT API 활용 시
– 필터링된 콘텐츠도 번역되도록 설정하는 방법이 존재.
– 민감도 필터에서 자유로운 결과를 얻을 수 있음.
-> 결과 확인 클릭!
질문이 있으시면 언제든 댓글 달아주세요! 다음에도 제 프롬프트 엔지니어링 노트로 돌아올게요~