• Home
  • 사이트맵
  • English

사용자지원

자주하는질문(FAQ)

홈 > 사용자지원 > 자주하는질문(FAQ)

데이터 목록
번호 구분 제목
139 IBM지원 작업에 대한 checkpoint/restart가 가능한가요?
Checkpoint 기능은 사용자의 작업 수행 중 적당한 시점에 작업의 정보를 디스크에 저장하여, 프로그램이 완료되지 않은 상태로 중단된 경우에도 다시 처음부터 수행하지 않고 정보가 저장된 상태 이후부터 수행할 수 있도록 해주며, 순차 프로그램과 병렬 프로그램 모두 지원됩니다. 자세한 사용법은 사용자 지침서 18장의 "Checkpoint/Restart" 부분을 참고하세요. 
138 IBM지원 wall_clock_limit을 지정하지 않으면 작업 submit이 안 되는데, 왜 이것을 지정해야만 합니까?
앞에서 대기 중인 작업의 수행에 영향을 미치지 않으면서 현재 가용한 자원만 사용하여 wall_clock_limit 시간 내에 작업을 마칠 수 있는 경우 먼저 수행하도록 허용하여 효율적으로 자원을 활용하기 위해서는 반드시 지정해야 하며, 지정하지 않으면 작업은 강제 종료됩니다.
단, wall_clock_limit을 넘어서 작업이 실행되면, LoadLeveler가 강제로 종료시키므로 안전하게 여유 시간을 주어 지정해야 합니다. 
137 IBM지원 submit script에서 반드시 지정해야 하는 ConsumableCpus 수가 무엇을 의미합니까?
serial, Pthread 또는 OpenMP 프로그램인 경우에는 실제로 사용할 CPU 개수를 뜻하며, MPI 작업인 경우에는 각 태스크당 쓰레드 개수라고 보면 됩니다.
특히, OpenMP 혹은 OpenMP+MPI 프로그램인 경우에는 OMP_NUM_THREADS 또는 XLSMPOPTS=parthds 변수의 값과 ConsumableCpus 값이 같아야하고, serial 혹은 순수 MPI 프로그램인 경우에는 ConsumableCpus(1)을 지정하면 됩니다.
136 IBM지원 backfill scheduling이란 무엇입니까?
현재 LoadLeveler에서 제공되고 있는 작업 스케쥴링 기법으로 앞에서 대기 중인 작업의 수행에 영향을 미치지 않으면서 현재 가용한 자원만 사용하여 wall_clock_limit 시간 내에 작업을 마칠 수 있는 경우, 먼저 수행하도록 허용하는 기법입니다.
135 IBM지원 LoadLeveler에서 현재 실행중인 작업을 종료하려면 어떻게 해야 하는가?
수행중이거나 대기중인 작업을 취소하려면, "llcancel JOB_ID" 명령어를 사용할 수 있습니다.
134 IBM지원 작업을 submit 하고 계속해서 pending 상태에 머무는 데 이유는 무엇인가요?
일반적으로 시스템 자원이 다른 작업에 의해서 점유되어 할당할 자원의 여유가 없는 경우입니다. 자신의 작업이 pending된 이유를 알려면 "llq -s JOB_ID" 명령어를 사용하여 확인할 수 있습니다. 
133 IBM지원 작업의 상태를 어떻게 확인하나요?
아래 예제와 같이 "llq" 명령어를 사용하면 됩니다. 
nobela:/system/super/operator> llq 

     Id      Owner Submitted ST PRI Class Running On 
------------ ------ ---------- -- --- ------ ------------ 
nobel.2740.0  hsyi   12/5 09:30 R 50  normal  nobel2 
nobel.2739.0  esim   12/5 09:22 R 50  normal  nobel3 
nobel.2741.0  hsyi   12/5 09:34 R 50  normal  nobel2 
nobel.2738.0  hsyi   12/5 09:21 R 50  normal  nobel3 
nobel.2727.0  hsyi   12/2 13:15 R 50  express  nobel2 
nobel.2734.0  yhkim  12/4 18:19 R 50  express  nobel2 

6 job steps in queue, 0 waiting, 0 pending, 6 running, 0 held
132 IBM지원 사용자 별로 실행시킬 수 있는 작업의 개수에 제한이 있나요?
사용자별로 실행 가능한 최대 작업수는 작업의 로드에 따라서 수시로 변하지만, 2003년 1월 현재 사용자별 3개로 제한되고 있습니다. 
131 IBM지원 클래스의 종류에는 어떤 것들이 있나요?
LoadLeveler에서 클래스는 단일 CPU를 사용하는 normal 클래스, 다중 CPU를 사용하는 p_normal 클래스 및 gaussian 작업만을 수행하는 데 사용하는 gauss 클래스로 구분된다. 
특히 사용자가 유의할 점은 Gaussian 작업은 p690 및 p630 시스템 모두를 사용하여 수행할 수 있지만, p630 시스템에서 Gaussian 작업을 수행하기 위해서는 반드시 gauss 클래스를 사용하여야 한다. 

클래스   이름  서비스  레벨 Priority Max Proc Max Jobs Wall_clock_limit 
normal    1      1      1        no      limit       24시간 
p_normal  1      1     96        no      limit      168시간 
gauss     1      1     32        no      limit      168시간
130 IBM지원 내 배치작업이 클래스의 제한 시간보다 더 오랜 실행시간을 요구하는 경우에는 무엇을 해야 하나요?
제한 시간을 초과하면 작업이 강제 종료되므로, 더 큰 CPU limit을 가진 큐로 수정 후 작업을 제출하여 주시기 바랍니다.
콘텐츠 만족도 조사

퀵메뉴

  • 사용안내
  • 슈퍼컴퓨팅 서비스
  • 슈퍼컴퓨팅 교육
  • PLSI
  • EDISON
  • 연구망
본문 처음으로 바로가기

KISITI 슈퍼컴퓨팅센터 대전광역시 유성구 과학로 335 한국과학기술정보연구원 문의 080-041-1991 / FAX 042-869-0569

Copyrightⓒ2012 KISTI SUPERCOMPUTION CENTER ALL RIGHTS RESERVED.

관련사이트 바로가기