메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

논문 기본 정보

자료유형
학술저널
저자정보
Thi My Tuyen Nguyen (Soongsil University) Yoosang Park (Soongsil University) Jaeyoung Choi (Soongsil University)
저널정보
Korean Institute of Information Scientists and Engineers Journal of KIISE Journal of KIISE Vol.48 No.1
발행연도
2021.1
수록면
7 - 12 (6page)
DOI
10.5626/JOK.2021.48.1.7

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

초록· 키워드

오류제보하기
행렬곱셈연산(DGEMM)은 선형대수학, 머신러닝, 통계분야 등에서 적용되는 핵심 계산 루틴으로, 프로세서 제조회사들이 여러 코어를 가진 단일노드에서 어셈블리 코드를 사용하여 직접 최적화시킨 루틴들을 발표하였으며, 다양한 자동 튜닝 기법을 통해 계산과정을 최적화시키기 위한 많은 연구들을 수행하였다. 행렬곱셈연산의 처리 시간을 효과적으로 줄이기 위해서는 노드별로 수행되는 곱셈과정을 최적화시켜 병렬컴퓨팅 환경에 적합한 형태로 처리할 수 있는 위한 방법이 필요하다. 본 논문에서는 Intel Knights Landing (KNL) 환경에서의 병렬 배정밀도 부동소수점 행렬곱셈연산(PDGEMM) 및 적용과정을 소개한다. 제안하는 적용과정의 세부사항은 병렬컴퓨팅 실행 환경을 위한 단일 노드의 행렬곱셈연산을 최적화한 부분행렬곱셈 과정과 KNL 실행 환경에 적용할 수 있는 Intel AVX-512 명령어를 적용할 수 있는 컴파일 과정을 포함한다. 실험에서는 제안하는 PDGEMM의 성능이 각 4개 및 16개 노드로 구성된 KNL 클러스터 환경에서 Intel Math Kernel Library (MKL)의 병렬 행렬곱셈루틴보다 각 6% 및 68% 향상된 성능을 보임을 확인하였다.

목차

요약
Abstract
1. Introduction
2. System Configuration
3. Blocked matrix-matrix multiplication
4. Blocking factors
5. Experiments
6. Conclusions
References

참고문헌 (16)

참고문헌 신청

함께 읽어보면 좋을 논문

논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!

이 논문의 저자 정보

이 논문과 함께 이용한 논문

최근 본 자료

전체보기

댓글(0)

0

UCI(KEPA) : I410-ECN-0101-2021-569-001489825