본문 바로가기

카테고리 없음

Machine Learning quiz

반응형

https://github.com/Ebazhanov/linkedin-skill-assessments-quizzes/blob/main/machine-learning/machine-learning-quiz.md

머신러닝

Q1. 당신은 전국 패스트푸드 체인점에서 일하는 데이터 과학 팀의 일원입니다. 추세를 보여주는 간단한 보고서를 만듭니다. 매장을 더 자주 방문하고 작은 식사를 구매하는 고객은 자주 방문하지 않고 더 많은 식사를 구매하는 고객보다 더 많은 지출을 합니다. 당신의 팀이 만들었을 가능성이 가장 높은 다이어그램은 무엇입니까?

  • 다중클래스 분류 다이어그램
  • 선형 회귀 및 산점도
  • 피벗 테이블
  • K-평균 클러스터 다이어그램

Q2. 당신은 대기업에 스팸 필터링 서비스를 판매하는 조직에서 근무합니다. 귀하의 조직에서는 기계 학습을 사용하도록 제품을 전환하려고 합니다. 현재 250,000개의 키워드 목록이 있습니다. 메시지에 이러한 키워드가 몇 개 이상 포함되어 있으면 스팸으로 식별됩니다. 머신러닝으로 전환하면 어떤 이점이 있을까요?

  • 제품이 스팸 메시지에서 새로운 패턴을 찾습니다.
  • 제품이 키워드 목록을 훨씬 더 빠르게 통과할 수 있습니다.
  • 제품의 키워드 목록이 훨씬 길어질 수 있습니다.
  • 제품은 훨씬 적은 수의 키워드를 사용하여 스팸 메시지를 찾을 수 있습니다.

Q3. 음악 스트리밍 서비스에서 근무하며 지도 머신러닝을 사용하여 음악을 다양한 장르로 분류하려고 합니다. 귀하의 서비스는 각 장르에서 수천 곡의 노래를 수집했으며 이를 훈련 데이터로 사용했습니다. 이제 서비스에 포함된 모든 노래의 작은 무작위 하위 집합을 꺼냅니다. 이 하위 집합을 무엇이라고 하나요?

  • 데이터 클러스터
  • 감독 세트
  • 빅 데이터
  • 테스트 데이터

Q4. 전통적인 컴퓨터 프로그래밍에서는 명령을 입력합니다. 머신러닝으로 무엇을 입력하나요?

  • 패턴
  • 프로그램들
  • 규칙
  • 데이터

Q5. 회사에서는 기존 자동차 보험 고객이 주택 소유자 보험에 가입할 가능성이 더 높은지 예측하려고 합니다. 주택 소유자 보험에 관해 가장 좋은 고객 접촉을 더 잘 예측하기 위한 모델을 만들었으며 이 모델은 분산은 낮지만 편향은 높았습니다. 데이터 모델에 대해 무엇을 말합니까?

  • 지속적으로 틀렸습니다.
  • 일관되지 않게 잘못되었습니다.
  • 일관되게 옳았습니다.
  • 결국은 옳고 그름은 마찬가지였습니다.

참고

Q6. 기후 변화의 영향을 받았을 수 있는 글로벌 날씨 패턴을 식별하려고 합니다. 그렇게 하려면 기계 학습 알고리즘을 사용하여 인간 기상학자가 인식할 수 없는 패턴을 찾아야 합니다. 시작할 곳은 어디입니까?

  • 기계가 악천후를 식별하는 방법을 학습할 수 있도록 화창한 날의 레이블이 지정된 데이터를 찾습니다.
  • 비지도 학습을 사용하여 기계가 대규모 날씨 데이터베이스에서 이상 현상을 찾도록 합니다.
  • 비정상적인 패턴의 훈련 세트를 생성하고 기계 학습 알고리즘에 이를 분류하도록 요청합니다.
  • 정상적인 날씨의 훈련 세트를 만들고 기계가 유사한 패턴을 찾도록 합니다.

Q7. 당신은 Naive Bayes 결과를 기반으로 K-최근접 이웃 결과의 정확성을 향상시키려는 데이터 과학 팀에서 일하고 있습니다. 이것은 무엇의 예입니까?

  • 회귀
  • 부스팅
  • 배깅
  • 스태킹

Q8. ____는 예측 변수와 결과 간의 관계를 살펴봅니다.

  • 회귀 분석
  • K-클러스터링을 의미함
  • 빅 데이터
  • 비지도 학습

Q9. 기계 학습 시스템의 상용 응용 프로그램의 예는 무엇입니까?

  • 데이터 입력 시스템
  • 데이터 웨어하우스 시스템
  • 대규모 데이터 저장소
  • 상품 추천 시스템

Q10. 이 이미지는 무엇을 설명합니까?

머신러닝 Q10

  • 의사결정 트리
  • 강화 학습
  • K-최근접 이웃
  • 명확한 추세선

Q11. 당신은 수십만 개의 전기 계량기를 소유한 전력 회사에서 근무합니다. 이 계량기는 인터넷에 연결되어 에너지 사용량 데이터를 실시간으로 전송합니다. 감독자는 기계 학습을 사용하여 이 사용 데이터를 분석하는 프로젝트를 지시하도록 요청합니다. 이 시나리오에서 기계 학습 알고리즘이 이상적인 이유는 무엇입니까?

  • 알고리즘은 계량기가 인터넷에 액세스하는 데 도움이 됩니다.
  • 알고리즘은 무선 연결을 향상시킵니다.
  • 알고리즘은 조직이 데이터 패턴을 확인하는 데 도움이 됩니다.
  • 기계 학습 알고리즘을 사용하여 IoT 장치를 만듭니다.

Q12. 수량 값을 예측합니다. '___'을 사용하세요.

  • 회귀
  • 클러스터링
  • 분류
  • 차원 축소

Q13. Naive Bayes를 Naive라고 부르는 이유는 무엇입니까?

  • 데이터가 없을 것이라고 순진하게 가정합니다.
  • 정확한 예측을 하려고도 하지 않습니다.
  • 예측 변수가 서로 독립적이라고 순진하게 가정합니다.
  • 모든 예측 변수가 서로 의존한다고 순진하게 가정합니다.

Q14. 당신은 아이스크림 가게에서 근무하며 외부 온도와 아이스크림 판매량 사이의 관계를 보여주는 아래 차트를 만들었습니다. 이 차트를 가장 잘 설명한 것은 무엇입니까?

머신러닝 Q14

  • 선형 회귀 차트입니다.
  • 감독된 추세선 차트입니다.
  • 의사결정 트리입니다.
  • 클러스터링 추세 차트입니다.

Q15. 머신러닝은 인공지능과 어떤 관련이 있나요?

  • 인공지능은 분류에 중점을 두는 반면, 머신러닝은 데이터를 클러스터링하는 데 중점을 둡니다.
  • 머신러닝은 데이터를 통한 학습에 의존하는 인공지능의 한 종류입니다.
  • 인공 지능은 비지도 기계 학습의 한 형태입니다.
  • 머신러닝과 인공지능은 같은 것입니다.

Q16. 머신러닝 알고리즘은 어떻게 더 정확한 예측을 합니까?

  • 알고리즘은 일반적으로 더 강력한 서버에서 실행됩니다.
  • 알고리즘은 데이터의 패턴을 더 잘 파악합니다.
  • 기계 학습 서버는 더 큰 데이터베이스를 호스팅할 수 있습니다.
  • 알고리즘은 구조화되지 않은 데이터에서 실행될 수 있습니다.

Q17. 당신은 보험회사에 다니고 있습니다. 어떤 기계 학습 프로젝트가 회사에 가장 큰 가치를 더해줄까요?

  • 회사 디렉터리를 호스팅할 인공 신경망을 만듭니다.
  • 기계 학습을 사용하여 위험을 더 잘 예측합니다.
  • 모든 Excel 스프레드시트를 하나의 데이터 레이크로 통합하는 알고리즘을 만듭니다.
  • 기계 학습과 빅데이터를 사용하여 급여 요건을 조사합니다.

Q18. 이 다이어그램에서 누락된 정보는 무엇입니까?

머신러닝 Q18

  • 트레이닝 세트
  • 비지도 데이터
  • 지도 학습
  • 이진 분류

Q19. 훈련 세트와 테스트 세트 모두에 동일한 데이터를 사용하지 않는 이유 중 하나는 무엇입니까?

  • 모델에 거의 적합하지 않을 것입니다.
  • 잘못된 알고리즘을 선택하게 됩니다.
  • 둘 다에 대한 데이터가 충분하지 않을 수 있습니다.
  • 거의 확실하게 모델에 과적합됩니다.

Q20. 귀하의 대학에서는 기계 학습 알고리즘을 사용하여 들어오는 학생 지원서를 분류하는 데 도움을 주기를 원합니다. 관리자는 입학 결정이 여성과 같은 특정 집단에 대해 편견을 가질 수 있는지 묻습니다. 가장 좋은 대답은 무엇입니까?

  • 기계 학습 알고리즘은 수학과 통계를 기반으로 하므로 정의에 따라 편견이 없습니다.
  • 데이터의 편향을 식별할 방법이 없습니다.
  • 기계 학습 알고리즘은 데이터의 편견을 제거할 만큼 강력합니다.
  • 인간이 생성한 모든 데이터는 편향되어 있으며 데이터 과학자는 이를 설명해야 합니다.

설명: 머신러닝 알고리즘에는 편향이 없지만 데이터에는 편향이 있을 수 있습니다.

Q21. 스태킹이란 무엇입니까?

  • 한 모델의 예측이 다른 모델의 입력이 됩니다.
  • 다양한 버전의 기계 학습 알고리즘을 사용합니다.
  • 결과를 높이기 위해 여러 가지 기계 학습 알고리즘을 사용합니다.
  • 훈련 세트와 테스트 세트를 함께 쌓습니다.

Q22. 소셜 미디어에서 새끼 고양이 사진을 식별하는 지도형 기계 학습 시스템을 만들고 싶습니다. 이를 위해 100,000개 이상의 새끼 고양이 이미지를 수집했습니다. 이 이미지 모음을 무엇이라고 부르나요?

  • 훈련 데이터
  • 선형 회귀
  • 빅 데이터
  • 테스트 데이터

Q23. 당신은 다양한 개 이미지를 함께 클러스터링하는 프로젝트를 진행하고 있습니다. 이미지를 촬영하여 중심 이미지로 식별합니다. 어떤 유형의 기계 학습 알고리즘을 사용하고 있나요?

  • 중심 철근
  • K-최근접 이웃
  • 이진 분류
  • K-클러스터링을 의미함

설명: 문제에는 "클러스터링"이 명시적으로 명시되어 있습니다.

Q24. 회사에서는 직원들이 이메일을 작성하는 데 소요되는 시간을 단축하기 위해 내부 이메일 텍스트 예측 모델을 구축하기를 원합니다. 당신은 무엇을 해야 합니까?

  • 모든 직원의 교육 이메일 데이터를 포함합니다.
  • 신입 직원의 교육 이메일 데이터를 포함합니다.
  • 숙련된 직원의 교육 이메일 데이터를 포함합니다.
  • 내부 이메일의 대부분을 작성하는 직원의 교육 이메일 데이터를 포함합니다.

Q25. 귀하의 조직에서는 사람들이 온라인 전문 프로필을 만들 수 있도록 허용합니다. 주요 기능은 전문적으로 서로 연결된 사람들의 클러스터를 만드는 기능입니다. 이러한 클러스터를 생성하는 데 어떤 유형의 기계 학습 방법이 사용됩니까?

  • 비지도 머신러닝
  • 이진 분류
  • 감독형 머신러닝
  • 강화 학습

Q26. 이 다이어그램은 무엇을 보여주는 좋은 예인가요?

머신러닝 Q26

  • K-최근접 이웃
  • 의사결정 트리
  • 선형 회귀
  • K-평균 클러스터

참고: 클러스터의 중심(C0, C1, C2)이 있습니다.

Q27. 랜덤 포레스트는 어떤 이전 기술을 수정하고 개선한 버전입니까?

  • 집계된 트리
  • 강화된 나무
  • 자루에 담긴 나무
  • 쌓인 나무

Q28. 자기 조직화 맵은 어떤 유형의 기계 학습에 특화된 신경망입니까?

  • 준지도 학습
  • 지도 학습
  • 강화 학습
  • 비지도 학습

Q29. K-평균 군집화에 대한 설명으로 옳은 것은 무엇입니까?

  • K-평균 클러스터링에서는 초기 중심이 무작위로 선택되는 경우가 있습니다.
  • K-평균 클러스터링은 지도 기계 학습에서 자주 사용됩니다.
  • 클러스터 수는 항상 무작위로 선택됩니다.
  • 정확하게 말하면 중심이 클러스터 외부에 있어야 합니다.

Q30. 환경과 상호 작용하고 오류와 보상에 대응하는 기계 학습 시스템을 만들었습니다. 어떤 유형의 머신러닝 시스템인가요?

  • 지도 학습
  • 준지도 학습
  • 강화 학습
  • 비지도 학습

Q31. 데이터 과학 팀은 이진 분류자를 구축해야 하며 가장 중요한 기준은 배포 시 가능한 가장 빠른 점수를 매기는 것입니다. 실시간으로 배포될 수도 있습니다. 배포 팀이 새로운 사례에 사용할 수 있는 가장 빠른 모델을 생성하는 기술은 무엇입니까?

  • 랜덤 포레스트
  • 로지스틱 회귀
  • KNN
  • 심층 신경망

Q32. 데이터 과학 팀에서는 K-최근접 이웃 분류 알고리즘을 사용하려고 합니다. 귀하의 팀 중 누군가가 25의 K를 사용하고 싶어합니다. 이 접근 방식의 문제점은 무엇입니까?

  • K 값이 높을수록 노이즈가 있는 데이터가 생성됩니다.
  • K 값이 높을수록 편향은 낮아지지만 분산은 증가합니다.
  • K 값이 높을수록 더 큰 훈련 세트가 필요합니다.
  • K 값이 높을수록 분산은 낮아지지만 편향은 증가합니다.

Q33. 기계 학습 시스템이 레이블이 지정되지 않은 데이터에서 숨겨진 구조를 설명하려고 합니다. 이 머신러닝 방법을 어떻게 설명하시겠습니까?

  • 지도 학습
  • 비지도 학습
  • 강화 학습
  • 준 비지도 학습

Q34. 당신은 고객을 위한 맞춤형 판촉 행사를 만들고 싶어하는 대규모 신용 카드 처리 회사에서 근무하고 있습니다. 데이터 과학 팀은 비슷한 구매를 한 고객을 그룹화하고 고객 충성도에 따라 고객을 나누는 기계 학습 시스템을 만들었습니다. 이 머신러닝 접근 방식을 어떻게 설명하시겠습니까?

  • 비지도 학습을 사용하여 트랜잭션을 클러스터링하고 비지도 학습을 사용하여 고객을 분류합니다.
  • 비지도 머신러닝만 사용합니다.
  • 지도 학습을 사용하여 클러스터를 생성하고 비지도 학습을 사용하여 분류합니다.
  • 강화학습을 이용해 고객을 분류합니다.

Q35. K-최근접 이웃을 사용하고 있으며 K=1입니다. 모델을 훈련할 때 무엇을 볼 수 있습니까?

  • 높은 분산 및 낮은 편향
  • 낮은 편향 및 낮은 분산
  • 낮은 분산 및 높은 편향
  • 높은 편향과 높은 분산

Q36. 비지도 학습에서는 데이터 모델 편향과 분산이 문제가 됩니까?

  • 아니요, 데이터 모델 편향과 분산은 강화 학습의 문제일 뿐입니다.
  • 예, 기계가 클러스터를 생성할 때 데이터 모델 편향이 문제가 됩니다.
  • 예, 데이터 모델 분산은 비지도 기계 학습 알고리즘을 교육합니다.
  • 아니요, 데이터 모델 편향 및 분산에는 지도 학습이 포함됩니다.

Q37. 이진 분류에 가장 적합한 선택은 무엇입니까?

  • K-평균
  • 로지스틱 회귀
  • 선형 회귀
  • 주성분 분석(PCA)

설명: 로지스틱 회귀는 결과를 한쪽 극단으로 편향시키기 때문에 이진 분류에서는 선형 회귀보다 훨씬 낫습니다. K-평균 클러스터링은 분류에 사용될 수 있지만 대부분의 시나리오에서는 정확하지 않습니다.
출처:

Q38. 전통적인 프로그래밍에서는 일반적으로 프로그래머가 명령을 입력합니다. 기계 학습을 사용하면 프로그래머가 입력합니다.

  • 지도 학습
  • 데이터
  • 비지도 학습
  • 알고리즘

설명: 이것은 매우 간단하고 기본적인 개념입니다.
출처:

Q39. 기계 학습 알고리즘이 고품질 데이터에 액세스하는 것이 왜 중요한가요?

  • 프로그래머가 불량한 데이터를 제거하는 데 너무 오랜 시간이 걸립니다.
  • 데이터의 품질이 높으면 알고리즘 개발이 더 쉬워집니다.
  • 낮은 품질의 데이터는 고품질 데이터보다 훨씬 더 많은 처리 능력을 필요로 합니다.
  • 데이터의 품질이 낮으면 부정확한 결과를 얻게 됩니다.

Q40. K-최근접 이웃에서는 이웃과 가까울수록 다음과 같은 가능성이 높아집니다.

  • 공통된 특성을 공유합니다.
  • 루트 노드의 일부가 됨
  • [ ]는 유클리드 연결을 가지고 있습니다.
  • 동일한 클러스터에 속해 있음

Q41. HBO 쇼 Silicon Valley에서 캐릭터 중 한 명이 Not Hot Dog라는 모바일 애플리케이션을 만듭니다. 사용자가 모바일 장치로 음식 사진을 찍도록 하여 작동합니다. 그러면 앱에서 해당 음식이 핫도그인지 여부를 알려줍니다. 앱을 만들기 위해 소프트웨어 개발자는 수십만 장의 핫도그 사진을 업로드했습니다. 이러한 유형의 머신러닝을 어떻게 설명하시겠습니까?

  • 강화 기계 학습
  • 비지도 머신러닝
  • 감독형 기계 학습
  • 준지도 기계 학습

Q42. 당신은 데이터 과학 팀이 비지도 학습 기계 알고리즘을 사용하여 신약 발견을 돕고자 하는 대규모 제약 회사에서 일하고 있습니다. 이 접근 방식의 장점은 무엇입니까?

  • 항생제와 같은 다양한 종류의 약물에 우선순위를 부여할 수 있습니다.
  • 발견하고 싶은 약물의 훈련 세트를 만들 수 있습니다.
  • 알고리즘은 유사한 특성을 가진 약물을 함께 묶습니다.
  • 인간 전문가는 발견을 안내하는 데 도움이 되는 약물 종류를 만들 수 있습니다.

설명: 이는 Stanford Machine Learning 과정에서 설명한 예와 유사합니다.
출처:

Q43. 2015년에 구글은 바둑에서 인간을 이길 수 있는 기계 학습 시스템을 만들었습니다. 이 극도로 복잡한 게임은 우주의 원자보다 더 많은 게임 플레이 가능성을 가지고 있다고 생각됩니다. 시스템의 첫 번째 버전은 수십만 시간 동안 인간의 게임 플레이를 관찰하여 승리했습니다. 두 번째 버전은 자신과 대결하면서 보상을 받으며 플레이하는 방법을 배웠습니다. 다양한 머신러닝 접근 방식으로의 전환을 어떻게 설명하시겠습니까?

  • 시스템이 지도 학습에서 강화 학습으로 전환되었습니다.
  • 시스템은 지도 학습에서 비지도 학습으로 발전했습니다.
  • 시스템은 비지도 학습9에서 지도 학습으로 발전했습니다.
  • 시스템은 강화 학습에서 비지도 학습으로 발전했습니다.

Q44. 귀하가 근무하는 보안 회사는 컴퓨터 네트워크 위협 탐지 장비에 기계 학습 알고리즘을 추가하는 것을 고려하고 있습니다. 머신러닝을 사용하면 어떤 이점이 있나요?

  • 발견되지 않은 위협으로부터 더 효과적으로 보호할 수 있습니다.
  • 하드웨어 요구 사항이 낮아질 가능성이 높습니다.
  • 개발 시간이 대폭 단축됩니다.
  • 기기의 속도가 빨라집니다.

Q45. 당신은 바이러스의 지역사회 확산을 추적하는 병원에서 근무합니다. 병원은 수십만 명의 참가자로부터 체온 데이터를 업로드하는 스마트워치 애플리케이션을 만들었습니다. 데이터를 분석하는 가장 좋은 기술은 무엇입니까?

  • 강화 학습을 사용하여 새로운 사람이 참여할 때 시스템에 보상을 제공합니다.
  • 비지도 기계 학습을 사용하여 기계가 발견한 패턴을 기반으로 사람들을 하나로 묶습니다.
  • 지도형 기계 학습을 사용하여 인구통계 데이터를 기준으로 사람을 정렬합니다.
  • 감독형 기계 학습을 사용하여 체온을 기준으로 사람을 분류합니다.

Q46. 머신러닝의 많은 발전은 '___'의 개선에서 비롯되었습니다.

  • 통계
  • 구조화된 데이터
  • 가용성
  • 알고리즘

Q47. 이 다이어그램은 무엇을 보여주는 좋은 예인가요?

머신러닝 Q45

  • 비지도 학습
  • 복잡한 클러스터
  • 다중 클래스 분류
  • k-최근접 이웃

Q48. Naive Bayes는 각 _ 예측변수를 살펴보고 각 클래스에 속하는 확률을 생성합니다.

  • 조건부
  • 멀티클래스
  • 독립
  • 바이너리

참고

Q49. 데이터 과학 팀의 누군가는 동일한 훈련 데이터에 대해 의사결정 트리, Naive Bayes 및 K-최근접 이웃을 동시에 사용한 다음 결과의 평균을 구할 것을 권장합니다. 이것은 무엇의 예입니까?

  • 회귀 분석
  • 비지도 학습
  • 고분산 모델링
  • 앙상블 모델링

Q50. 데이터 과학 팀은 기계 학습을 사용하여 스팸 메시지를 더 효과적으로 필터링하려고 합니다. 팀은 스팸 또는 스팸이 아닌 것으로 식별된 100,000개의 메시지 데이터베이스를 수집했습니다. 지도 기계 학습을 사용하는 경우 이 데이터 세트를 무엇이라고 부르겠습니까?

  • 기계 학습 알고리즘
  • 트레이닝 세트
  • 빅데이터 테스트 세트
  • 데이터 클러스터

Q51. 당신은 고객이 자신의 사진 한 장을 업로드하여 인터넷에서 자신의 모든 이미지를 볼 수 있도록 하는 웹사이트에서 일하고 있습니다. 데이터 모델은 색상, 눈, 성별, 안경, 수염 등 5가지 특성을 사용하여 사람을 사진과 일치시킵니다. 귀하의 고객은 자신이 없는 수만 장의 사진을 받는다고 불평해 왔습니다. 문제는 무엇입니까?

  • 모델을 데이터에 과대적합하고 있습니다.
  • 더 작은 훈련 세트가 필요합니다.
  • 모델을 데이터에 과소적합하고 있습니다.
  • 더 큰 훈련 세트가 필요합니다.

Q52. 상사는 인사부에서 지원자를 잘 정의된 그룹으로 분류하는 데 도움이 되는 기계 학습 시스템을 만들도록 요청합니다. 어떤 유형의 시스템을 더 추천하시겠습니까?

  • 최고의 후보자를 함께 클러스터링하는 비지도 기계 학습 시스템입니다.
  • 이러한 유형의 프로젝트에는 기계 학습 시스템을 권장하지 않습니다.
  • 페타바이트 규모의 고용 데이터에 의존하는 딥 러닝 인공 신경망.
  • 지원자를 기존 그룹으로 분류하는 지도형 기계 학습 시스템입니다.

Q53. 귀하와 귀하의 데이터 과학 팀은 1TB의 예시 데이터를 보유하고 있습니다. 일반적으로 해당 데이터로 무엇을 하시나요?

  • 훈련 세트로 사용합니다.
  • 빅 데이터라는 라벨을 붙였습니다.
  • 훈련 세트와 테스트 세트로 분할합니다.
  • 테스트 세트로 사용합니다.

Q54. 귀하의 데이터 과학 팀은 비디오 게임에서 인위적인 상대 역할을 할 수 있는 기계 학습 제품을 개발하고 있습니다. 팀은 보상에 초점을 맞춘 기계 학습 알고리즘을 사용하고 있습니다. 기계가 어떤 일을 잘 수행하면 결과의 품질이 향상됩니다. 이러한 유형의 머신러닝 알고리즘을 어떻게 설명하시겠습니까?

  • 준지도 기계 학습
  • 감독형 머신러닝
  • 비지도 머신러닝
  • 강화 학습

Q55. 모델은 단일 배치의 데이터로 학습됩니다.

  • 일괄 학습
  • 오프라인 학습
  • A와 B 모두
  • 위에 해당사항 없음

Q56. 다음 중 지도 학습이 아닌 것은 무엇입니까?

  • 의사결정 트리
  • 선형 회귀
  • PCA
  • 나이브 베이지안

Q57. 집의 기하학적 위치와 같은 공간 데이터에 대한 클러스터링을 수행하고 싶다고 가정해 보겠습니다. 우리는 다양한 크기와 모양의 클러스터를 생산하고자 합니다. 다음 중 가장 적절한 방법은 무엇입니까?

  • 의사결정 트리
  • K-클러스터링을 의미함
  • 밀도 기반 클러스터링
  • 모델 기반 클러스터링

Q58. 로지스틱 회귀를 사용한 경사하강법에 가장 적합한 오류 함수는 다음과 같습니다.

  • 엔트로피 함수.
  • 제곱 오차입니다.
  • 교차 엔트로피 기능.
  • 실수 횟수입니다.

Q59. MLE(최대 우도 추정)의 분산과 비교하여 MAP(최대 A 사후 추정)의 분산은 '___'입니다.

  • 높음
  • 같은
  • 더 낮음
  • 위의 항목 중 하나일 수 있습니다.

Q60. '___'은 훈련 데이터를 모델링할 수도 없고 새로운 데이터로 일반화할 수도 없는 모델을 나타냅니다.

  • 잘 맞음
  • 과적합
  • 과소적합
  • 무엇보다도

Q61. 이러한 유형의 분류 문제를 어떻게 설명하시겠습니까?

머신러닝 Q58

  • 이것은 다중 클래스 분류 챌린지입니다.
  • 다중 바이너리 분류 문제입니다.
  • 이진 분류 문제입니다.
  • 강화 분류 챌린지입니다.
  • 설명: 데이터가 두 개 이상의 범주 또는 클래스로 분류되는 것을 나타냅니다. 따라서 이는 다중 클래스 분류 문제입니다.

Q62. 데이터 모델에 과소적합된다는 것은 무엇을 의미합니까?

  • 훈련 세트에 데이터가 너무 적습니다.
  • 훈련 세트에 데이터가 너무 많습니다.
  • 분산은 많지 않지만 편향이 높습니다.
  • 모델의 편향은 낮지만 분산은 높습니다.

설명: 과소적합 데이터 모델은 일반적으로 편향이 높고 분산이 낮습니다. 과적합된 데이터 모델은 편향이 낮고 분산이 높습니다.

Q63. 아시아 사용자가 귀사의 얼굴 인식 모델이 얼굴 표정을 제대로 식별하지 못한다고 불평합니다. 당신은 무엇을 해야 합니까?

  • 테스트 데이터에 아시아인 얼굴을 포함하고 모델을 다시 훈련시킵니다.
  • 업데이트된 하이퍼파라미터 값으로 모델을 재교육합니다.
  • 더 작은 배치 크기로 모델을 다시 학습시킵니다.
  • 교육 데이터에 아시아인 얼굴을 포함하고 모델을 다시 교육합니다.

설명: 대답은 자명합니다. 아시아 사용자가 불만을 제기하는 유일한 그룹인 경우 훈련 데이터에는 더 많은 아시아인 얼굴이 있어야 합니다.

Q64. 당신은 점심 데이트 상대를 찾는 데 도움을 주는 웹사이트에서 일하고 있습니다. 웹사이트는 고객에게 완벽한 날짜를 찾기 위해 500개 이상의 예측 변수를 사용한다고 자랑하지만 많은 고객은 일치하는 항목이 거의 없다고 불평합니다. 모델에 어떤 문제가 있을 수 있나요?

  • 훈련 세트가 너무 큽니다.
  • 모델을 데이터에 과소적합하고 있습니다.
  • 모델을 데이터에 과대적합하고 있습니다.
  • 컴퓨터가 부정확한 클러스터를 생성하고 있습니다.

설명: // 이 질문은 Q49와 매우 유사하지만 정반대의 시나리오를 포함합니다.

'그 대답은 다소 모호하고 불안정합니다. 일치하는 수가 적다고 해서 모델이 과적합된다는 것을 반드시 의미하는 것은 아닙니다. 특히 독립 변수가 500개(!) 있는 경우에는 더욱 그렇습니다. 나에게는 임계값(일치) 기준이 너무 엄격하여 적은 수의 일치만 허용되는 것이 더 합리적으로 들립니다. 따라서 해결책은 임계 기준을 완화하거나 후보자 수를 늘리는 것입니다.

Q65. (대부분) 온라인에서 커널 시각화(또는 다른 참조)를 볼 때마다 실제로 다음과 같은 내용을 보게 됩니다.

  • 커널이 추출하는 것
  • 기능 맵
  • 커널의 모습

Q66. 소프트맥스 이전의 클래스 A, B, C에 대한 활성화는 10,8, 3이었습니다. 클래스 A와 클래스 B의 소프트맥스 값 차이는 다음과 같습니다.

  • 76%
  • 88%
  • 12%
  • 0.0008%

이미지

Q67. 방금 스크랩한 새 데이터세트에 누락된 값이 많이 있는 것 같습니다. 그 문제를 최소화하는 데 어떤 조치가 도움이 됩니까?

  • 제어된 무작위 값의 현명한 채우기
  • 누락된 값을 모든 샘플의 평균으로 대체
  • 결함이 있는 샘플 제거
  • 전가

Q68. 다음 중 비지도 학습 또는 차원 축소 기술로 사용할 수 있는 방법은 무엇입니까?

  • SVM
  • PCA
  • LDA
  • TSNE

Q69. ANN에서 활성화 함수를 사용하는 주요 동기는 무엇입니까?

  • 복잡한 비선형 패턴 캡처
  • 연속 값을 "ON"(1) 또는 "OFF"(0) 값으로 변환
  • 그라데이션이 사라지거나 폭발하는 문제를 방지하는 데 도움이 됩니다.
  • 각 뉴런을 개별적으로 활성화하는 능력.

Q70. 범주형(이산형) 지도 학습에 가장 적합한 손실 함수는 무엇인가요?

  • 쿨백-라이블러(KL) 손실
  • 이진 교차엔트로피
  • 평균 제곱 오차(MSE)
  • 모든 L2 손실

Q71. 올바른 옵션은 무엇입니까?

이미지

아니요. 레드 블루 그린
1. 유효성 검사 오류 학습 오류 테스트 오류
2. 학습 오류 테스트 오류 유효성 검사 오류
3. 최적의 오류 유효성 검사 오류 테스트 오류
4. 유효성 검사 오류 학습 오류 최적의 오류
  • 1
  • 2
  • 4

Q72. 누군가가 해변에 가기로 결정했는지 여부를 표시하는 의사결정 트리를 만듭니다. 이 결정에는 비, 흐림, 맑음의 세 가지 요소가 있습니다. 이 세 가지 요소를 무엇이라고 하나요?

  • 트리 노드
  • 예측변수
  • 루트 노드
  • 결정자

/// 이 노드는 누군가가 해변에 가기로 결정했는지 여부를 결정합니다. 예를 들어 비가 오는 사람들은 대부분 해변에 가지 않을지 여부를 결정합니다.`

Q73. 모델을 훈련하려면 수천 개의 이미지에 신속하게 레이블을 지정해야 합니다. 당신은 무엇을 해야 합니까?

  • 이미지에 라벨을 붙일 머신 클러스터 설정
  • 이미지의 하위 집합을 만들고 직접 라벨을 지정합니다.
  • Naive Bayes를 사용하여 자동으로 레이블을 생성합니다.
  • 이미지에 수동으로 라벨을 붙일 사람을 고용합니다.

Q74. 그림의 적합선과 데이터는 어떤 패턴을 나타냅니까?

이미지

  • 낮은 편향, 높은 분산
  • 높은 편향, 낮은 분산
  • 높은 편향, 높은 분산
  • 낮은 편향, 낮은 분산
  • // 데이터가 정확하게 분류되어 데이터세트에 과적합도 과소적합도 아니기 때문입니다.

Q75. 모바일 애플리케이션에서 분산 신경망을 실행하려면 기계 학습 프로세스를 선택해야 합니다. 당신은 어느 것을 선택하시겠습니까?

  • Scikit-학습
  • 파이토치
  • Tensowflow 라이트
  • 텐서플로우

Q76. 라벨이 지정된 데이터의 가장 좋은 예는 무엇입니까?

  • 스프레드시트
  • 녹음된 음성 메일 메시지 20,000개
  • 자동차 이미지 100,000개
  • 수백 기가바이트의 오디오 파일

Q77. 통계에서 효과를 찾는 가설 검정의 확률(발견할 효과가 있는 경우)로 정의되는 것은 무엇입니까?

  • 신뢰
  • 알파
  • 중요성

Q78. 웹에서 음식 조리법을 식별하기 위한 기계 학습 알고리즘을 만들고 싶습니다. 이를 위해 다양한 조건부 확률을 살펴보는 알고리즘을 만듭니다. 따라서 게시물에 밀가루라는 단어가 포함되어 있으면 레시피일 가능성이 약간 더 높습니다. 밀가루와 _설탕_이 모두 포함되어 있으면 레시피일 가능성이 더욱 높습니다. 어떤 유형의 알고리즘을 사용하고 있나요?

  • 나이브 베이즈 분류기
  • K-최근접 이웃
  • 다중 클래스 분류
  • 의사결정 트리

Q79. 게으른 학습이란 무엇입니까?

  • 기계 학습 알고리즘이 대부분의 프로그래밍을 수행하는 경우
  • 데이터 스크러빙을 수행하지 않는 경우
  • 학습이 지속적으로 일어나는 경우
  • 처음에 하나의 큰 인스턴스에서 계산을 실행할 때

Q80. Q-러닝 강화학습이란?

  • 보상이 포함된 지도형 머신러닝
  • 잘 확립된 모델에 크게 의존하는 비지도 학습 유형
  • 시간이 지남에 따라 정확도가 저하되는 강화 학습 유형
  • 보상에 초점을 맞춘 강화 학습 유형

참고 .&text=%20it%20learns%20the%20value,독립적으로%20of%20the%20agent's%20actions>) 설명:Q-learning은 모델이 없는 강화 학습 알고리즘입니다.Q-learning은 값 기반입니다. 학습 알고리즘. 가치 기반 알고리즘은 방정식(특히 벨만 방정식)을 기반으로 가치 함수를 업데이트합니다.

Q81. 모델의 데이터는 편향과 분산이 낮습니다. 다이어그램에서 데이터 포인트가 어떻게 그룹화될 것으로 예상하시나요?

  • 그들은 예측된 결과에서 서로 밀접하게 그룹화될 것입니다.
  • 그들은 서로 밀접하게 그룹화되어 있지만 예상과는 거리가 멀습니다.
  • 예측 결과 주위에 흩어져 있을 것입니다.
  • 그들은 예상된 결과에서 멀리 흩어질 것입니다.

참조

Q82. 기계 학습 시스템은 레이블이 지정된 예를 사용하여 미래 데이터를 예측하고 해당 데이터를 예측 결과와 비교한 다음 모델을 만듭니다. 이 기계 학습 방법을 가장 잘 설명하는 것은 무엇입니까?

  • 비지도 학습
  • 준지도 학습
  • 지도 학습
  • 반강화 학습

참고자료

Q83. 1983년 영화 WarGames에서 컴퓨터는 자신과 대결하여 체스 게임을 마스터하는 방법을 배웁니다. 컴퓨터는 어떤 기계 학습 방법을 사용하고 있었나요?

  • 이진 학습
  • 지도 학습
  • 비지도 학습
  • 강화 학습

참고

Q84. 클래스 예측 확률이라는 것에 대해 기계 학습 알고리즘을 사용하고 있습니다. 어떤 알고리즘을 가장 많이 사용하고 있나요?

  • 다중 클래스 이진 분류
  • 나이브 베이즈
  • 비지도 분류
  • 의사결정 트리 분석

설명: 순진한 베이즈 알고리즘을 사용하여 테리어, 사냥개, 스포츠견 등 세 가지 종류의 개 품종을 구별할 수 있습니다. 각 클래스에는 머리카락 길이, 키, 몸무게라는 세 가지 예측 변수가 있습니다. 알고리즘은 클래스 예측 확률이라는 작업을 수행합니다.

참조

Q85. 모델이 데이터에 과소적합된 것을 수정하는 가장 효과적인 방법 중 하나는 무엇입니까?

  • 훈련 클러스터 생성
  • 예측 변수 제거
  • 강화 학습 사용
  • 더 많은 예측 변수 추가

Q86. 데이터 과학 팀은 지루하거나 너무 뻔한 보고서를 작성했다는 이유로 종종 비판을 받습니다. 팀의 발전을 돕기 위해 무엇을 할 수 있나요?

  • 팀이 아마도 모델을 데이터에 과소적합하고 있다고 제안합니다.
  • 비지도 학습이 더 흥미로운 결과를 가져올 것이라고 제안합니다.
  • 올바른 기계 학습 알고리즘을 선택하고 있는지 확인하세요.
  • 팀이 더 흥미로운 질문을 하도록 격려합니다.

Q87. 비정형 데이터와 정형 데이터의 차이점은 무엇인가요?

  • 구조화되지 않은 데이터는 항상 텍스트입니다.
  • 구조화되지 않은 데이터는 저장하기가 훨씬 쉽습니다.
  • 구조화된 데이터에는 데이터 유형이 명확하게 정의되어 있습니다.
  • 구조화된 데이터가 훨씬 더 많이 사용됩니다.

Q88. 당신은 특정 도구를 사용하는 사람들의 사진을 인터넷에서 검색하는 소프트웨어 도구를 개발하려는 스타트업에서 일하고 있습니다. 최고경영자(CEO)는 머신러닝 알고리즘을 활용하는 데 큰 관심을 갖고 있습니다. 시작하기에 가장 좋은 곳으로 무엇을 추천하시겠습니까?

  • 비지도 기계 학습 알고리즘을 사용하여 모든 사진을 하나로 묶습니다.
  • 비지도 기계 학습 알고리즘으로 데이터 레이크를 만듭니다.
  • 비지도 및 지도 기계 학습을 조합하여 기계 정의 데이터 클러스터를 생성합니다.
  • 지도 기계 학습을 사용하여 미리 결정된 훈련 세트를 기반으로 사진을 분류합니다.

Q89. 지도 기계 학습에서 데이터 과학자는 종종 데이터 모델의 과소적합과 과적합 간의 균형을 맞추는 문제에 직면합니다. 더 나은 예측을 위해 훈련 세트를 조정해야 하는 경우가 많습니다. 이 잔액을 무엇이라고 하나요?

  • 언더/오버 챌린지
  • 클러스터링 분류 간의 균형
  • 편향-분산 절충
  • 멀티클래스 훈련 세트 챌린지

Q90. 조건부 확률이란 무엇입니까?

  • 한 가지 일을 하는 것이 다른 일에 영향을 미칠 확률
  • 특정 조건이 충족될 확률
  • 특정 조건에 따라 무언가가 항상 부정확할 확률
  • 정답이 될 확률

Q91. K-평균 클러스터링은 어떤 유형의 기계 학습 알고리즘인가요?

  • 강화
  • 감독됨
  • 감독되지 않음
  • 분류

Q92. 앙상블 모델링이란 무엇입니까?

  • 학습 및 테스트 데이터 세트의 앙상블을 생성하는 경우
  • 알고리즘을 실행하기 위해 서로 다른 서버의 앙상블을 생성하는 경우
  • 앙상블에 가장 적합한 알고리즘을 찾은 경우
  • 여러 기계 학습 알고리즘 앙상블을 사용하는 경우

Q93. 데이터 모델의 편향에 대한 가장 좋은 정의는 무엇입니까?

  • 편향은 예측값이 분산되는 경우입니다.
  • 편향은 예측 값과 결과 사이의 격차입니다.
  • 편향은 여러 가지 이유로 데이터가 잘못된 경우입니다.
  • 편향은 값이 항상 같은 비율만큼 벗어나는 경우입니다.

Q94. 지도 머신러닝에 가장 적합한 프로젝트는 무엇인가요?

  • 데이터 스크러빙
  • 위험 점수 예측
  • 세금 신고 소프트웨어
  • 스프레드시트 통합

Q95. 의사결정나무는 언제 가장 일반적으로 사용되는가?

  • 빅데이터 제품 포함
  • 지도 기계 학습 이진 분류 문제
  • 최고의 데이터 클러스터를 찾으려면
  • Q-learning 강화학습에서 "Q"를 결정하기 위한 [ ]

Q96. 수십 개의 쇼핑몰을 소유한 조직은 얼굴 인식을 사용하여 고객을 식별하는 기계 학습 제품을 만들고 싶어합니다. 그러한 모델을 개발하는 데 있어 주요 과제는 무엇입니까?

  • 대부분의 기계 학습 모델은 비디오용으로 설계되지 않았습니다.
  • 기업이 동의 없이 사람을 식별하는 것은 비윤리적일 수 있습니다.
  • 지도 학습과 비지도 학습 사이에서 결정하기 어려울 것입니다.
  • 동영상의 이미지 품질이 개인을 식별할 만큼 높지 않습니다.

Q97. 다음 기계 학습 알고리즘 중 비지도 학습 알고리즘은 무엇입니까?

  • 랜덤 포레스트
  • k-최근접 이웃
  • 서포트 벡터 머신
  • K-는 다음을 의미합니다.

설명:
훈련 중에 k-평균은 관측치를 k개의 클러스터로 분할합니다. 추론하는 동안 주어진 데이터 포인트를 거리별로 가장 가까운 클러스터에 할당합니다. k-평균은 훈련을 위해 레이블이 지정된 데이터가 필요하지 않기 때문에 비지도 학습입니다.

Q98. 여러 의사결정 트리의 결과를 평균화하면 다음과 같은 이점이 있습니다.

  • 분산 증가
  • 편향 증가
  • 분산 감소
  • 편향 감소

설명: 모델을 평균화하면 개별 모델보다 안정성이 높아지고 분산이 낮아집니다. 수학적으로 $\text{Var}(\bar{X})=\frac{\text{Var}(X)}{N}$를 기억하세요.

Q99. 목적 함수를 최적화하기 위해 전체 훈련 세트(확률적 경사 하강 아님)를 사용하여 전체 배치 경사 하강을 수행합니다. 훈련 세트를 섞는 것이 필요합니까?

  • 예. 그렇지 않으면 훈련이 끝날 때 최적화가 최소값을 중심으로 진동합니다.
  • 예, 모델이 테스트 데이터 세트로 일반화되도록 돕기 위한 것입니다.
  • 아니요, 데이터 세트는 이미 데이터 수집 프로세스에서 섞인 것으로 간주될 수 있으므로 필요하지 않습니다.
  • 아니요. 각 업데이트는 어쨌든 전체 데이터세트를 통과하며 순서는 중요하지 않기 때문입니다.

설명: 모든 반복에서 전체 배치 경사하강법은 전체 훈련 세트를 사용하여 경사를 계산합니다. 데이터가 처리되는 순서는 그라데이션 값에 영향을 주지 않습니다.

매 반복마다 전체 배치 경사하강법은 전체 훈련 세트를 사용하여 경사를 계산합니다. 데이터가 처리되는 순서는 그라데이션 값에 영향을 주지 않습니다.

Q100. 1,000,000개의 이미지를 수신했으며 이를 학습, 개발 및 테스트 세트 간에 96%/2%/2%로 분할했습니다. 모델을 훈련하고 결과를 분석했습니다. 문제에 대해 추가 작업을 한 후 개발 세트에서 잘못 레이블이 지정된 데이터를 수정하기로 결정했습니다.

다음 중 어떤 진술에 동의하시나요?

  • 또한 개발 세트와 테스트 세트가 여전히 동일한 분포에서 나오도록 테스트 세트에서 잘못 레이블이 지정된 데이터를 수정해야 합니다.
  • 훈련 세트에서 잘못 레이블이 지정된 데이터를 수정해야 하며 이제 훈련 세트가 개발 세트와 훨씬 더 달라지는 것을 방지해야 합니다.
  • 테스트 세트는 실제 데이터 분포를 반영해야 하므로 테스트 세트에서 잘못 레이블이 지정된 데이터를 수정해서는 안 됩니다.
  • 잘못 레이블이 지정된 데이터를 수정하려면 유사한 분포를 유지하기 위해 세 세트(학습/개발/테스트) 모두에서 수정해야 합니다.

설명: 개발 및 테스트 세트가 "실제" 데이터에 가장 가까운 분포를 갖는 것이 중요합니다.

Q101. 이미지에 고양이가 포함되어 있는지("1") 고양이가 포함되어 있지 않은지("0") 분류하기 위한 이진 분류 작업을 진행 중입니다. 모델을 훈련하기 위해 최소화하기 위해 어떤 손실을 선택하시겠습니까?

  • L = y 로그 y^ + (1−y) 로그 (1− y^)
  • L = - y 로그 y^ - (1−y) 로그 (1− y^)
  • L = || y - y^ ||22
  • L = || y - y^ ||22 + 상수

설명: 훈련 세트에 대한 이진 교차 엔트로피 손실을 최소화하려고 합니다.

Q102. 소셜 미디어에 자신의 사진을 공유한 상위 100명의 사람을 찾는 기계 학습 알고리즘을 만들고 싶습니다. 사용하기에 가장 좋은 기계 학습 방법은 무엇입니까?

  • 강화 학습
  • 이진 분류
  • K-최근접 이웃
  • 비지도 학습

Q103. 유명한 데이터 과학자 Andrew Ng는 "응용 기계 학습은 기본적으로 기능 엔지니어링입니다."라고 말한 것으로 인용되었습니다. 기능 엔지니어링이란 무엇입니까?

  • 웹 데이터에서 새로운 기능을 스크랩합니다.
  • 원래 변수를 결합하고 수정하여 새 변수 생성
  • 소프트웨어에 추가할 혁신적인 새 사용자 기능 설계
  • 딥러닝을 사용하여 데이터에서 특징 찾기

Q104. 미적분학에서 df/dx란 무엇입니까?

  • 예측 기능
  • x의 f의 도함수
  • x의 도함수
  • [ ]는 f를 x로 나눈 것과 같습니다.

Q105. 잘 디자인된/잘 맞는 모델이란 무엇입니까?

  • 동일한 데이터로 훈련 및 테스트된 것
  • 정확도가 높고 결과를 정확하게 예측할 수 있는 것
  • 레이블이 지정된 훈련 데이터로 훈련된 것
  • 훈련 데이터의 모든 조건과 순열의 철저한 세트로 훈련된 것

Q106. _ 기반 협업 필터링은 자신이 구매한 상품과 유사한 상품을 추천할 때 발생합니다.

  • 역사
  • 아이템
  • 유사성
  • 구입

Q107. 빈칸 채우기: 두 가지 다변량 대치 기술은 _ 대치자와 _ 대치자입니다.

  • 감독됨, 감독되지 않음
  • 반복, KNN
  • 유사성, 회귀성
  • 정규화, 스케일링

Q108. Keras 라이브러리를 사용하여 회귀 모델을 작업하고 있습니다. 모델을 훈련하기 위해 Model 클래스에서 어떤 방법을 사용합니까?

  • 예측하다
  • 컴파일
  • 적합
  • get_weights

Q109. K 최근접 이웃 알고리즘에서 정규화의 목표는 무엇입니까?

  • 서로 비교할 수 있도록 데이터 포인트를 정규화
  • 직선 모델을 사용하여 훈련 데이터를 기반으로 예측
  • 모델을 나타내는 선의 기울기를 구합니다.
  • 의사결정 경계를 더욱 규칙적으로 만들기

Q110. 두 변수 x와 y 사이에 추세가 없으면 x와 y 사이에 _ 연결이 있다고 말합니다.

  • 선형
  • 지수
  • 무작위가 아닌
  • 무작위

Q111. 기계 학습 알고리즘 사용을 고려하고 있다면 오늘 할 수 있는 최선의 일은 품질 _을 확보하는 것입니다.

  • 데이터
  • 프로세서
  • 네트워킹
  • 통계 기법

설명: "기계 학습 알고리즘을 실행하기 전에 우수한 데이터 품질을 보장하는 것은 전체 데이터 과학 및 기계 학습 워크플로에서 중요한 단계입니다." 출처

Q112. 조직의 최고 다양성 책임자는 엔지니어링 부서에 인종 및 성별 다양성이 부족하다는 점을 우려합니다. 수십만 개의 새로운 채용 지원서를 분류하는 데 도움이 되는 지도형 기계 학습 시스템을 생성하라는 요청을 받았습니다. 인사부는 내부 채용 데이터를 사용해야 한다고 주장합니다. 당신이 직면할 수 있는 위험에는 어떤 것들이 있습니까?

  • 인공 신경망이 효율적으로 처리하기에는 데이터가 너무 많습니다.
  • 기계 학습 시스템은 다양성을 정의할 수 없으므로 이를 채용 개선에 사용할 방법이 없습니다.
  • 이러한 유형의 데이터에는 기계 학습 시스템을 사용할 수 없습니다.
  • 시스템이 내부 데이터를 사용하는 경우 채용에 대한 기존 편견이 증폭될 수 있습니다.

설명: "AI가 편향된 데이터 세트에 대해 훈련을 받으면 자연스럽게 비참한 결과를 초래할 수 있는 편향된 결정을 내릴 것입니다." 출처

Q113. 2013년 Google의 DeepMind 프로젝트는 구식 Atari 비디오 게임인 Pong을 플레이할 수 있는 기계 학습 알고리즘을 만들었습니다. 알고리즘은 일련의 보상을 생성하여 기계에 게임 방법을 가르쳤습니다. 기계가 공을 성공적으로 반환할 때마다 기계는 보상을 받았습니다. 상대가 공을 놓칠 때마다 기계는 보상을 받았습니다. 이러한 유형의 머신러닝 알고리즘을 어떻게 설명하시겠습니까?

  • 빅데이터 머신러닝.
  • 좋은 구식 인공 지능(GOFAI).
  • 강화 학습.
  • 지도 학습.

설명: 강화 학습은 알고리즘이 환경과 상호 작용하여 보상이나 불이익을 받는 기계 학습의 한 분야입니다. [출처](https://www.deepmind.com/publications/playing-atari-with-deep- 강화 학습)

Q114. 수십 개의 쇼핑몰을 소유한 조직은 얼굴 인식을 사용하여 고객을 식별하는 기계 학습 제품을 만들고 싶어합니다. 그러한 제품을 개발하는 데 있어 주요 과제 중 하나는 무엇입니까?

  • 영상 속 이미지의 화질이 개인을 식별할 만큼 높지 않습니다.
  • 지도 학습과 비지도 학습 사이에서 결정하기가 어려울 것입니다.
  • 기업이 동의 없이 개인을 식별하는 것은 비윤리적일 수 있습니다.
  • 대부분의 기계 학습 알고리즘은 비디오용으로 설계되지 않았습니다.

설명: 기계 학습 알고리즘에는 동의 및 개인 정보 보호에 관한 많은 윤리적 질문이 있습니다. 출처

Q115. 비정형 데이터와 정형 데이터의 차이점은 무엇입니까?

  • 구조화되지 않은 데이터는 저장하기가 훨씬 쉽습니다.
  • 구조화된 데이터에는 데이터 유형이 명확하게 정의되어 있습니다.
  • 구조화되지 않은 데이터는 항상 텍스트입니다.
  • 구조화된 데이터가 훨씬 더 많이 사용됩니다.

Q116. 당신은 특정 제품을 사용하는 사람들의 사진을 인터넷에서 검색하는 소프트웨어 도구를 개발하려는 스타트업에서 일하고 있습니다. 최고경영자(CEO)는 머신러닝 알고리즘을 활용하는 데 큰 관심을 갖고 있습니다. 시작하기 가장 좋은 곳으로 무엇을 추천하시겠습니까?

  • 비지도 기계 학습 알고리즘을 사용하여 데이터 레이크를 생성합니다.
  • 비지도 기계 학습 알고리즘을 사용하여 모든 사진을 하나로 묶습니다.
  • 지도 기계 학습을 사용하여 미리 결정된 훈련 세트를 기반으로 사진을 분류합니다.
  • 비지도 및 지도 기계 학습을 조합하여 기계 정의 데이터 클러스터를 생성합니다.

Q117. 강화 학습의 정의는 무엇입니까?

  • 기계는 결과를 지속적으로 개선하기 위해 다양한 모델을 반복합니다.
  • 개발자는 이미 알고 있는 내용을 강화합니다.
  • 기계가 지도 학습을 강화합니다.
  • 알려지지 않은 데이터를 강화하는 것입니다.

설명: 강화 학습은 기본적으로 반복 프로세스입니다. 출처

Q118. 최소 제곱 회귀는 선형 모델에서 최대 우도 추정 문제를 해결합니다.

  • 사실
  • 거짓

*설명: * 최소 제곱 회귀는 종속 변수와 하나 이상의 독립 변수 사이에 가장 적합한 선형 관계를 찾는 데 사용되는 방법입니다. 이는 관찰된 값과 예측된 값 사이의 차이 제곱의 합을 최소화합니다. 이는 가우스 잡음 가정 하에서 관찰된 데이터의 가능성을 최대화하는 것과 같습니다.

Q118. 당신은 전국 패스트푸드 체인점에서 일하는 데이터 과학 팀의 일원입니다. 추세를 보여주는 간단한 보고서를 만듭니다. 매장을 더 자주 방문하고 작은 식사를 구매하는 고객은 자주 방문하지 않고 더 많은 식사를 구매하는 고객보다 더 많은 지출을 합니다. 당신의 팀이 만들었을 가능성이 가장 높은 다이어그램은 무엇입니까?

  • 다중클래스 분류 다이어그램
  • 선형 회귀 및 산점도
  • 피벗 테이블
  • K-평균 클러스터 다이어그램

Q120. 신경망의 방사형 기저 함수에서 레이어의 전체 유형은 __입니다.

  • 1
  • 2
  • 3
  • 4

설명: 방사형 기반 함수는 입력 레이어, 숨겨진 레이어, 출력 레이어의 세 가지 레이어로 구성된 특별한 클래스의 피드포워드 신경망입니다.

Q121. 하향식 파서란 무엇입니까?

-[x] 문장(기호 S)을 가정하고 개별 전말단 기호가 작성될 때까지 하위 수준 구성요소를 연속적으로 예측하는 것으로 시작합니다. -[ ] 문장(기호 S)을 가정하고 개별 전말단 기호가 작성될 때까지 상위 수준 구성요소를 연속적으로 예측하는 것으로 시작합니다. -[ ] 하위 구성요소를 가설하고 연속적으로 문장을 예측하는 것(기호 S)으로 시작합니다. -[ ] 상위 구성요소를 가설하고 연속적으로 문장을 예측(기호 S)으로 시작합니다.

설명: 하향식 파서는 문장(기호 S)을 가정하고 개별 사전 터미널 기호가 작성될 때까지 하위 수준 구성 요소를 연속적으로 예측하는 것으로 시작됩니다.

Q122. 목표에 가장 가까운 노드를 확장하는 검색 방법은 무엇입니까?

-[ ] 최고 우선 검색 -[x] 탐욕스러운 최고 우선 검색 -[ ] A* 검색 -[ ] 언급된 사항 없음

설명: 탐욕스러운 최고 우선 검색은 가중치 그래프의 간선 가중치를 무시하고 평가 함수가 휴리스틱 함수와 엄격하게 동일한 정보 기반 검색 알고리즘입니다. 출처

Q123. 휴리스틱 검색 성능을 향상시키는 데 사용되는 것은 무엇입니까?

-[ ] 노드의 품질 -[x] 휴리스틱 기능의 품질 -[ ] 노드의 단순한 형태 -[ ] 언급된 사항 없음

설명: 문제를 완화함으로써 좋은 휴리스틱을 구축할 수 있으므로 휴리스틱 검색 성능이 향상될 수 있습니다.``

반응형