전체 글 썸네일형 리스트형 dp-900 데이터 유형 및 데이터 저장소 식별 정규화는 데이터를 각각 열이 적고 한 테이블에서 다른 테이블로의 참조가 있는 잘 정의된 여러 테이블로 분할하는 프로세스입니다 정규화에서는 최종적으로 데이터가 잘 정의된 좁은 테이블(좁은 테이블은 열이 적은 테이블)로 분할되고, 한 테이블에서 다른 테이블로 참조가 이루어집니다 데이터의 구조뿐만 아니라 데이터 사용 방식에 따라 다양한 방식으로 데이터를 분류할 수 있습니다. 이제 다양한 데이터 유형의 특성에 대해 알아보겠습니다. 관계형 데이터베이스는 아마도 가장 잘 알려진 데이터 보유 모델일 것입니다. 테이블과 열의 구조가 단순하기 때문에 처음에는 쉽게 사용할 수 있습니다. 그러나 견고한 구조로 인해 몇 가지 문제가 발생할 수 있습니다. 예를 들어 고객 정보가 들어 있는 데이터베이스에서 주소가 두 개 이상인 .. 더보기 ms azure certifications https://learn.microsoft.com/en-us/credentials/certifications/azure-data-scientist/?wt.mc_id=azdatafund_azdatasci_webpage_extlp Microsoft Certified: Azure Data Scientist Associate - Certifications Azure data scientists have subject matter expertise in applying data science and machine learning to implement and run machine learning workloads on Azure. learn.microsoft.com https://learn.microsoft.co.. 더보기 시험 AI-900 https://learn.microsoft.com/ko-kr/credentials/certifications/resources/study-guides/ai-900 시험 AI-900: Microsoft Azure AI 기본 사항 학습 가이드 시험 AI-900: Microsoft Azure AI 기본 사항 학습 가이드 | Microsoft Docs learn.microsoft.com https://learn.microsoft.com/ko-kr/credentials/certifications/exams/ai-900/ 시험 AI-900: Microsoft Azure AI Fundamentals - Certifications 시험 AI-900: Microsoft Azure AI Fundamentals learn... 더보기 시험 DP-900: Microsoft Azure https://learn.microsoft.com/ko-kr/credentials/certifications/resources/study-guides/dp-900 시험 DP-900: Microsoft Azure 데이터 기본 사항 핵심 데이터 개념 설명(15~20%) 핵심 데이터 워크로드 유형 설명 스트리밍 데이터 설명 배치 데이터와 스트리밍 데이터의 차이점 설명 관계형 데이터의 특성 설명 데이터 분석 핵심 개념 설명 데이터 시각화(예: 시각화, 보고, 비즈니스 인텔리전스(BI)) 설명하기 막대형 차트 및 원형 차트와 같은 기본 차트 유형 설명하기 분석 기술(예: 설명, 진단, 예측, 규범, 인지) 설명하기 eLT 및 ETL 처리 설명 데이터 처리의 개념 설명 Azure에서 관계형 데이터로 작업하는 방법 .. 더보기 modeling 없이 chatGPT를 만드는 방법 한빛출판사 프리뷰어스 사이트에 기고한 내용입니다. https://www.notion.so/modeling-chatGPT-04fc8db66274499abcc2687f9891d89e chatGPT의 지식에 해당하는 부분은 말그대로 FACT, 사실이 기재되어있어야 한다. 정확하지 않은 정보가 아닌 경우, 사용자에게 신뢰도는 매우 하락할 수 있다. 또한 chatGPT에 사용할 LLM모델을 직접 만드는 경우, 대량의 문서를 학습시켜 만들지만, 일반적으로 규모가 작은 개발회사에서 적은 비용으로 LLM modeling을 바로 할 수가 없다. GPU보드 주문부터, 또는 Cloud서비스를 통해 instance를 갖추고 그 안에 LLM Modeling할 인프라부터 설계해야 된다. chatGPT를 위한 LLM생성 기본적인 .. 더보기 torch, book https://github.com/iarai/science4cast GitHub - iarai/science4cast: Details for the Science4Cast competition Details for the Science4Cast competition. Contribute to iarai/science4cast development by creating an account on GitHub. github.com 토치 심플 모델 #책 #파이토치 딥러닝 마스터 소스코드 https://github.com/deep-learning-with-pytorch/dlwpt-code GitHub - deep-learning-with-pytorch/dlwpt-code: Code for the book Deep.. 더보기 python 실행시간 측정 및 디버깅 If you want to time how long it takes for a whole cell to run, you’d use %%timeit like so: Debugging in the Notebook With the Python kernel, you can turn on the interactive debugger using the magic command %pdb. When you cause an error, you'll be able to inspect the variables in the current namespace. https://ipython.readthedocs.io/en/stable/interactive/magics.html Built-in magic commands — IPyt.. 더보기 데이터 분석 - 회귀 계수 축소 모델 * 일반적으로 변수가 많을수록 회귀 모델의 학습 데이터에 대한 성능은 높아지고, 학습하지 않은 데이터에 대한 성능은 낮아짐. 변수가 많아지면 변수의 해석력도 낮아짐. -> 회귀모델이 지니고 있는 학습의 특성때문임. 종속 변수를 설명하는 독립 변수의 설명력이 있을 때 각각의 독립 변수가 지니고 있는 이 설명력을 중복으로 가져가ㅣ는 못함. 예를들어, 키와 발의 크기를 이용해 몸무게를 예측한다고 했을 때, '키'라는 변수가 지니고 있는 설명력과 '발'이라는 변수가 지니고 있는 설명력이 겹치는 부분이 있을텐데, 이에 대해 각각의 변수가 중복으로 가져가지 못함. 그러면 키나 몸무게 하나만 적합시켰을 때, 그 변수의 영향력 보다 적게 나오게 됩니다. 이러한 문제 때문에 적절한 변수만 선택해 사용하는 것이 중요함. .. 더보기 이전 1 2 3 4 5 6 7 8 ··· 102 다음