mnist data 다운로드

데이터 집합을 로드할 때 표준 기본 버전이 사용됩니다. 그러나 사용할 데이터 집합의 주요 버전을 지정하고 결과에 사용된 데이터 집합의 버전을 보급하는 것이 좋습니다. 자세한 내용은 데이터 집합 버전 조정에 대한 설명서를 참조하십시오. 2011년에, 0.27%의 오류율은, 이전 최고 결과에 향상, 신경망의 유사한 시스템을 사용하여 연구원에 의해 보고되었습니다. [13] 2013년 DropConnect를 사용한 신경망의 정규화를 기반으로 한 접근 방식은 0.21%의 오차율을 달성했다고 주장되었습니다. [14] 2016년 단일 컨볼루션 신경망 최고 성능은 0.31%의 오차율이었습니다. [15] 2018년 8월 현재 실시간 데이터 보강을 사용하여 MNIST 학습 데이터에 대해 학습된 단일 컨볼루션 신경망의 성능이 0.26%입니다. [16] 또한, 병렬 컴퓨팅 센터 (Khmelnitskiy, 우크라이나)는 0.21 %의 오류율로 MNIST에서 수행하는 5 개의 컨볼루션 신경망의 앙상블을 얻었습니다. [17] [18] 테스트 데이터 집합의 일부 이미지는 거의 읽을 수 없으며 테스트 오류율 0%에 도달하지 못할 수 있습니다.

[16] 2018년 버지니아 대학교 시스템 및 정보 공학과의 연구원들은 3종류의 신경망(완전히 연결, 재발 및 컨볼루션 신경망)으로 0.18%의 오차를 발표했다[19]. 2020년 1월 조나스 마투자스(Jonas Matuzas)는 0.17±0.01% 정확도를 제공하는 github[20] 쉽게 복제가능한 코드를 게시했습니다. TensorFlow 데이터 집합은 TensorFlow에서 사용할 준비가 된 데이터 집합의 컬렉션을 제공합니다. 데이터를 다운로드 및 준비하고 tf.dataset을 생성합니다. 모든 tfds 데이터 집합에는 피쳐 사전이 텐서 값에 피처 이름을 매핑합니다. MNIST와 같은 일반적인 데이터 집합에는 „이미지“ 및 „레이블“이라는 2개의 키가 있습니다. 아래에서 단일 예제를 검사합니다. MNIST 데이터 집합은 미국 국립 표준 기술 연구소(NIST)의 두 데이터 집합에서 생성되었습니다. 교육 세트는 250명의 다른 사람, 50%의 고등학생, 그리고 인구조사국의 50%의 직원으로 구성되어 있습니다. 테스트 세트에는 동일한 분할을 따르는 다른 사람의 필기 숫자가 포함되어 있습니다. n_digit_mnist.py 인수 옵션을 참조하고 새 데이터 집합을 직접 구성합니다. 숫자 도메인 간격이 있는 4자리 MNIST의 예: 이 교육 집합 및 테스트 집합을 통해 많은 메서드를 테스트했습니다.

다음은 몇 가지 예입니다. 방법에 대한 자세한 내용은 향후 논문에 제공됩니다. 이러한 실험 중 일부는 입력 이미지가 왜곡된 데이터베이스 버전을 사용했습니다(수직에 가장 가까운 셰이프의 주 축을 계산하고 선을 이동하여 수직으로 만들수 있음). 다른 실험에서는 원래 학습 샘플의 인위적으로 왜곡된 버전으로 학습 세트를 보강했습니다. 왜곡은 교대, 배율 조정, 기울이기 및 압축의 임의의 조합입니다. 2004년에, 0.42%의 최고 케이스 오류 비율은 Rosenblatt의 지각 원리에 근거를 둔 3개의 신경 층을 가진 신경 분류기인 LIRA에게 불린 새로운 분류기이용을 사용하여 연구원에 의해 데이터베이스에 달성되었습니다. [11] 데이터 집합은 다음 발행물에 소개된다. 데이터 집합을 인용하기 위해 다음 bibtex를 사용하십시오: 잠재적인 독점 문제와 더 큰 유연성으로 인해 이미지 자체의 이미지를 공개하는 대신 원래 MNIST 데이터 집합에서 데이터 집합을 생성하기 위한 코드를 릴리스합니다. 벤치마킹을 위해 코드를 통해 다시 생성되지만 결정적으로 생성되는 네 가지 표준 데이터 집합을 릴리스합니다.

MNIST 데이터베이스는 http://yann.lecun.com/exdb/mnist/ [1] 카타코다, https://www.katacoda.com/basiafusinska/courses/tensorflow-getting-started/tensorflow-mnist-beginner 아래에서 사용할 수 있습니다. 다운로드=False를 지정하지 않는 한 데이터를 다운로드하고 준비합니다.