DeepMind는 알고리즘 개발을 위한 새로운 AI 시스템에 대해 자세히 설명합니다.

Alphabet Inc.의 DeepMind 유닛 오늘 돌쩌귀 수학적 문제를 해결하는 데 사용할 수 있는 새로운 알고리즘을 발견할 수 있는 인공 지능 시스템인 AlphaTensor.

DeepMind 연구원들은 AlphaTensor를 사용하여 행렬 곱셈을 수행하는 새로운 방법을 개발했습니다. 행렬 곱셈은 데이터 처리 중에 AI 응용 프로그램 및 기타 소프트웨어에서 널리 사용되는 계산 유형입니다. DeepMind에 따르면 AlphaTensor는 지금까지 가능했던 것보다 더 빠르게 행렬 곱셈을 수행하는 방법을 찾았습니다.

AlphaTensor는 2018년 DeepMind에서 데뷔한 AlphaZero라는 인공 지능 시스템을 기반으로 합니다. AlphaZero는 체스, 바둑, 장기와 같은 보드 게임을 하도록 설계되었습니다. DeepMind는 복잡한 수학적 문제를 해결할 수 있도록 AI 시스템에 대한 일련의 업그레이드를 수행했습니다.

새로 등장한 AlphaTensor 시스템을 사용하여 DeepMind에서 가속화된 계산인 행렬 곱셈은 행렬과 관련된 산술 유형입니다. 행렬은 스프레드시트와 유사한 행과 열로 배열된 숫자 집합입니다. 행렬 곱셈은 두 개의 행렬을 사용하여 세 번째 행렬을 생성하는 산술 연산입니다.

수학자들은 1960년대에 그러한 계산을 수행하는 새롭고 빠른 방법이 발견될 때까지 수세기 동안 하나의 특정한 방식으로 행렬 곱셈을 수행했습니다. 그러나 이 더 빠른 방법은 상대적으로 적은 수를 포함하는 특정 유형의 행렬 곱셈에만 적용할 수 있습니다. 또한 DeepMind 연구원은 “이 문제의 더 큰 버전은 아직 해결되지 않은 상태로 남아 있습니다.”라고 설명합니다. 블로그 게시물 오늘.

DeepMind에 따르면 AlphaTensor 시스템은 더 빠른 행렬 곱셈 방법의 개선된 버전을 발견했습니다. 또한 AI는 행렬 곱셈 연산을 수행하기 위해 수천 개의 완전히 새로운 알고리즘을 생성했습니다. 이러한 알고리즘 중 일부는 Nvidia Corp. 그래픽 카드와 같은 특정 유형의 하드웨어에서 실행되도록 최적화되어 있습니다.

AlphaTensor를 구축하기 위해 DeepMind 연구원은 알고리즘 감지를 위한 새로운 방법을 개발했습니다.

연구원들은 새로운 행렬 곱셈 알고리즘을 발견하는 작업을 TensorGame이라는 게임으로 전환했습니다. 게임에서 이기려면 AI 시스템이 텐서 분해와 같은 복잡한 산술 연산을 완료해야 합니다. 텐서 분석을 완료하면 AI 시스템이 게임에서 승리할 수 있을 뿐만 아니라 그 과정에서 새로운 행렬 곱셈 알고리즘이 생성됩니다.

READ  라이브 시청 | 우주비행사, 헬멧 사고 8개월 만에 첫 우주 유영

DeepMind는 AlphaTensor에 알고리즘 감지에 특별히 최적화된 신경망 아키텍처를 탑재했습니다. 다음으로 Alphabet 유닛은 강화 학습이라는 방법을 사용하여 AI 시스템을 훈련했습니다. 특정 작업을 반복적으로 수행하도록 하여 시행착오를 통해 신경망의 정확도를 높이는 방법입니다.

AlphaTensor를 사용하여 DeepMind는 알려진 가장 빠른 행렬 곱셈 해결 알고리즘 중 하나의 보다 효율적인 버전을 발견할 수 있었습니다. “예를 들어, 학교에서 가르치는 기존 알고리즘이 100개의 곱셈을 사용하여 4 x 5 x 5 x 5 행렬을 곱하고 그 숫자가 인간의 독창성을 통해 80으로 줄어들면 AlphaTensor는 76개의 곱셈만 사용하여 동일한 연산을 수행하는 알고리즘을 찾았습니다. ” 연구원들이 자세히 설명합니다. DeepMind에서.

AlphaTensor는 또한 수천 개의 새로운 행렬 곱셈 알고리즘을 발견했습니다. 프로젝트의 일환으로 DeepMind는 Nvidia의 V100 그래픽 카드 및 Google LLC에서 개발한 AI 칩인 TPU v2와 같은 특정 칩에서 실행되도록 최적화된 알고리즘을 개발하기 위해 AlphaTensor를 전담했습니다. Alphabet 단위에 따르면 이러한 알고리즘은 기존 행렬 곱셈 방법보다 최대 20% 더 빠르게 작동합니다.

딥마인드 연구원은 “행렬 곱셈은 컴퓨터 그래픽, 디지털 통신, 신경망 훈련, 과학 컴퓨팅을 포함한 많은 계산 작업의 필수 구성요소이기 때문에 발견된 AlphaTensor 알고리즘은 이러한 영역에서 계산을 훨씬 더 효율적으로 만들 수 있습니다.”라고 설명했습니다. “모든 유형의 대상을 고려하는 AlphaTensor의 유연성은 에너지 사용과 같은 메트릭을 개선하는 알고리즘을 설계하기 위한 새로운 응용 프로그램에 박차를 가할 수도 있습니다.”

사진: 딥마인드

Cube Club 및 Cube Event 전문가 커뮤니티에 가입하여 우리의 사명에 대한 지원을 보여주십시오. Amazon Web Services 및 Amazon.com CEO Andy Gacy, Dell Technologies 설립자 겸 CEO인 Michael Dell, Intel CEO Pat Gelsinger 및 더 많은 저명한 인물과 전문가가 포함된 커뮤니티에 참여하십시오.

답글 남기기

이메일 주소는 공개되지 않습니다.