'딥러닝' 카테고리의 글 목록

본문 바로가기

딥러닝

강화학습 deadly triad 불안정성을 높이는 치명적 삼위일체* 함수근사: 메모리와 컴퓨터의 계산 능력을 훨씬 능가하는 상태 공간으로부터 일반화를 수행하는 강력하고 측정 가능한 방법(선형 함수 근사 또는 ANN)* 부트스트랩: mc 방법처럼, 실제 보상 및 완전한 이득에 전적으로 의존하기 보다는 (동적 프로그래밍이나 TD방법처럼) 이미 존재하는 추정값을 포함하고 있는 목표를 갱신하는 것* 비활성 정책 훈련: 목표 정책에 의해 만들어진 분포보다는 전이의 분포에 대해 훈련하는 것. 동적 프로그래밍에서처럼 상태 공간에 있는 모든 상태를 균일하게 일괄적으로 갱신하는 것은 목표 정책을 따르지 않는다. 이것이 비활성 정책 훈련의 예제이다.함수근사를 피하는 게 가장 어렵다. 규모가 큰 문제로의 확장성 및 굉장히 많은 것을 표현할 수 있는 능력을.. 더보기

MLM (Masked Language Model) BERT에서 사전학습은 MLM과 NSP를 통해 이뤄짐MLM(Masked Language Model)입력문서 내 단어(토큰)의 15%가 [MASK]토큰으로 가려지고, 원래 단어를 추측하는 빈칸 채우기 (fill-in-the-blank)작업NSP(Next Sentence Prediction): 두 개의 문장을 선택해서 그들이 원래 문장에서 (앞뒤로 놓인)연속적인 문장인지 아닌지를 예측하는 작업BERT, ALBERT, DistilBERT 모델의 MLM 결과는 비슷하다https://github.com/jasonyim2/book3/blob/main/Transformers%2017-26.ipynb book3/Transformers 17-26.ipynb at main · jasonyim2/book3Contribute.. 더보기

python arg생성 후 실행 안되는 에러 "error: unrecognized arguments: -f" 가 떴을 때,#방법1#args = parser.parse_args() #AS-isargs, unknown = parser.parse_known_args()윗줄을 두번째 줄과 같이 바꿔준다.#방법2또는parser.parse_args('')처럼 빈 arg스트링 하나를 넣어도 된다. 더보기

device가 사용중일 때 나타나는 에러 process %d terminated with exit code %d 더보기

chatopenai error 트러블슈팅 호출하다 error나고 호출도 안한 함수 잘못 쓰고 있다, 에러라는 attribute가 없다 등의 이상한 에러를 내뱉어서구글링 해보니 이게 다 버전문제라고해서chatopenai 최신버전으로 업뎃하고, import도 warnning메세지를 보고 고쳤더니 된다. open AI 에러메세지는 아직 직관적이지 않아서, 난해한 편인듯. from langchain.chat_models import ChatOpenAIfrom langchain.llms import OpenAIfrom langchain_openai import ChatOpenAImodel_name = "gpt-3.5-turbo"temperature = 0.0llm = ChatOpenAI(model_name=model_name, .. 더보기

Vector Store Index Creator, memory https://hipster4020.tistory.com/189 LangChain이란? LangChain으로 강력한 LLM 서비스 구축하기LangChain은 LLM에서 구동되는 APP을 개발하기 위한 프레임워크입니다. LangChain에서 제공되는 라이브러리를 활용하여 쉽게 LLM 기술들을 활용할 수 있습니다. 현재는 Javascript, Python으로 구분해서 관리hipster4020.tistory.com변환기, 임베딩 및 검색기강력한 정보 검색 시스템을 만들려면 벡터 저장소, 임베딩 및 검색기를 결합하는 복잡한 시스템이 필요합니다.Vector Store Index Creator - 벡터 저장소, 임베딩 및 검색기를 통합하여 정보 검색 시스템 설정 프로세스를 간소화합니다.프로세스의 주요 단계문서 로딩.. 더보기

시험 AI-900 https://learn.microsoft.com/ko-kr/credentials/certifications/resources/study-guides/ai-900 시험 AI-900: Microsoft Azure AI 기본 사항 학습 가이드 시험 AI-900: Microsoft Azure AI 기본 사항 학습 가이드 | Microsoft Docs learn.microsoft.com https://learn.microsoft.com/ko-kr/credentials/certifications/exams/ai-900/ 시험 AI-900: Microsoft Azure AI Fundamentals - Certifications 시험 AI-900: Microsoft Azure AI Fundamentals learn... 더보기

modeling 없이 chatGPT를 만드는 방법 한빛출판사 프리뷰어스 사이트에 기고한 내용입니다. https://www.notion.so/modeling-chatGPT-04fc8db66274499abcc2687f9891d89e chatGPT의 지식에 해당하는 부분은 말그대로 FACT, 사실이 기재되어있어야 한다. 정확하지 않은 정보가 아닌 경우, 사용자에게 신뢰도는 매우 하락할 수 있다. 또한 chatGPT에 사용할 LLM모델을 직접 만드는 경우, 대량의 문서를 학습시켜 만들지만, 일반적으로 규모가 작은 개발회사에서 적은 비용으로 LLM modeling을 바로 할 수가 없다. GPU보드 주문부터, 또는 Cloud서비스를 통해 instance를 갖추고 그 안에 LLM Modeling할 인프라부터 설계해야 된다. chatGPT를 위한 LLM생성 기본적인 .. 더보기

목록 더보기

티스토리툴바