본문 바로가기

딥러닝

강화학습 deadly triad 불안정성을 높이는 치명적 삼위일체* 함수근사: 메모리와 컴퓨터의 계산 능력을 훨씬 능가하는 상태 공간으로부터 일반화를 수행하는 강력하고 측정 가능한 방법(선형 함수 근사 또는 ANN)* 부트스트랩: mc 방법처럼, 실제 보상 및 완전한 이득에 전적으로 의존하기 보다는 (동적 프로그래밍이나 TD방법처럼) 이미 존재하는 추정값을 포함하고 있는 목표를 갱신하는 것* 비활성 정책 훈련: 목표 정책에 의해 만들어진 분포보다는 전이의 분포에 대해 훈련하는 것. 동적 프로그래밍에서처럼 상태 공간에 있는 모든 상태를 균일하게 일괄적으로 갱신하는 것은 목표 정책을 따르지 않는다. 이것이 비활성 정책 훈련의 예제이다.함수근사를 피하는 게 가장 어렵다. 규모가 큰 문제로의 확장성 및 굉장히 많은 것을 표현할 수 있는 능력을.. 더보기
MLM (Masked Language Model) BERT에서 사전학습은 MLM과 NSP를 통해 이뤄짐MLM(Masked Language Model)입력문서 내 단어(토큰)의 15%가 [MASK]토큰으로 가려지고, 원래 단어를 추측하는 빈칸 채우기 (fill-in-the-blank)작업NSP(Next Sentence Prediction): 두 개의 문장을 선택해서 그들이 원래 문장에서 (앞뒤로 놓인)연속적인 문장인지 아닌지를 예측하는 작업BERT, ALBERT, DistilBERT 모델의 MLM 결과는 비슷하다https://github.com/jasonyim2/book3/blob/main/Transformers%2017-26.ipynb book3/Transformers 17-26.ipynb at main · jasonyim2/book3Contribute.. 더보기
python arg생성 후 실행 안되는 에러 "error: unrecognized arguments: -f" 가 떴을 때,#방법1#args = parser.parse_args() #AS-isargs, unknown = parser.parse_known_args()윗줄을 두번째 줄과 같이 바꿔준다.#방법2또는parser.parse_args('')처럼 빈 arg스트링 하나를 넣어도 된다. 더보기
device가 사용중일 때 나타나는 에러 process %d terminated with exit code %d 더보기
chatopenai error 트러블슈팅 호출하다 error나고 호출도 안한 함수 잘못 쓰고 있다, 에러라는 attribute가 없다 등의 이상한 에러를 내뱉어서구글링 해보니 이게 다 버전문제라고해서chatopenai 최신버전으로 업뎃하고, import도 warnning메세지를 보고 고쳤더니 된다. open AI 에러메세지는 아직 직관적이지 않아서, 난해한 편인듯.    from langchain.chat_models import ChatOpenAIfrom langchain.llms import OpenAIfrom langchain_openai import ChatOpenAImodel_name = "gpt-3.5-turbo"temperature = 0.0llm = ChatOpenAI(model_name=model_name, .. 더보기
Vector Store Index Creator, memory https://hipster4020.tistory.com/189 LangChain이란? LangChain으로 강력한 LLM 서비스 구축하기LangChain은 LLM에서 구동되는 APP을 개발하기 위한 프레임워크입니다. LangChain에서 제공되는 라이브러리를 활용하여 쉽게 LLM 기술들을 활용할 수 있습니다. 현재는 Javascript, Python으로 구분해서 관리hipster4020.tistory.com변환기, 임베딩 및 검색기강력한 정보 검색 시스템을 만들려면 벡터 저장소, 임베딩 및 검색기를 결합하는 복잡한 시스템이 필요합니다.Vector Store Index Creator - 벡터 저장소, 임베딩 및 검색기를 통합하여 정보 검색 시스템 설정 프로세스를 간소화합니다.프로세스의 주요 단계문서 로딩.. 더보기
시험 AI-900 https://learn.microsoft.com/ko-kr/credentials/certifications/resources/study-guides/ai-900 시험 AI-900: Microsoft Azure AI 기본 사항 학습 가이드 시험 AI-900: Microsoft Azure AI 기본 사항 학습 가이드 | Microsoft Docs learn.microsoft.com https://learn.microsoft.com/ko-kr/credentials/certifications/exams/ai-900/ 시험 AI-900: Microsoft Azure AI Fundamentals - Certifications 시험 AI-900: Microsoft Azure AI Fundamentals learn... 더보기
LLM 평가 개요 자연어 처리 영역에서 LLM의 성능을 평가하는 것은 중요한 측면입니다. 이 평가를 위한 주요 도구 중 하나는 ROUGE(Recall-Oriented Understudy for Gisting Evaluation) 측정항목입니다. ROUGE는 주로 LLM의 텍스트 생성 품질을 평가하는 데 사용됩니다. GPT-2와 같은 LLM은 종종 텍스트 완성이나 요약과 같은 작업에 참여합니다. 생성된 텍스트의 효율성은 확장성 및 일관성 문제로 인해 사람의 판단만으로는 효과적으로 측정할 수 없습니다. 예를 들어, 아래 코드를 실행하여 다음 프롬프트에 따라 텍스트를 생성하세요. 여기에 어떤 점수를 할당할 수 있는지 생각해 보고 다양한 텍스트에 점수를 매기는 표준화된 측정 기준을 생각해 보세요. # Generate tex.. 더보기