• Home
  • 사이트맵
  • English

사용자지원

자주하는질문(FAQ)

홈 > 사용자지원 > 자주하는질문(FAQ)

데이터 목록
번호 구분 제목
59 TACHYON_작업실행 작업 수행시 다음과 같은 에러 메지지가 뜨는 이유가 무엇인가요? “Timeout during client startup. Killing remote processes...DONE”
● 이것은 mpi startup시 각 계산 노드간의 ssh connection이 정상적으로 수립이 안되어 발생합니다.
즉, mpi가 정상적으로 startup할 수 없어서 강제 종료되면서 발생합니다.
보통은 네트워크 장애이거나 아니면 /home01에 대한 access가 안되는 경우에 발생합니다.
이와 같은 상황이 발생하면 관리자에게 알려주시기 바랍니다. 
58 TACHYON_작업실행 SGE를 사용하면서 실행파일을 스크레치 디렉토리로 옮기지 않고 링크해서 사용하고 싶습니다. 어떻게 링크를 하나요? 예를들어 /work01/myid/hd에서 작업을 할 때 /home01/myid/jd/의 디렉토리에 실행파일이 들어있습니다. 그리고 이때 script 파일은 어디에 두어나 되나요?
● /home01/myid/jd 디렉토리를 /work01/myid/hd 로 링크
=> ln -s /home01/myid/jd /work01/myid/hd

이때 Job script는 항상 work 디렉토리에 있어야 됩니다.
예를 들어 exec.x를 수행하기 위한 script.sh는 "/work01/myid/" 내 어떤 디렉토리에 있어도 되며, script.sh에서 exec.x를 실행하는 내용을 “/work01/myid/hd/exec.x”이나 “/home01/myid/jd/exec.x”으로 절대경로를 정확히 적어주시면 됩니다.
57 TACHYON_작업실행 Hybrid code(MPI + OpenMP)를 사용하여 mpi 4 tasks, openmp 4 threads를 사용할 때, Script에 어떻게 지정해 주나요?
● -pe mpi_1cpu 4 :노드당 1개의 cpu를 사용하고 전체 4개의 cpu를 사용하는 것입니다.
-l OMP_NUM_THREADS=4 : mpi에서 사용하는 cpu마다 4개의 threads를 생성하는 것입니다.
이렇게 하시면 4개의 노드에 각각 1개의 mpi cpu를 사용하고 cpu마다 각각 4개의 openmp threads가 생성됩니다.
그리고 스크립트 아래 부분 mpirun 바로 위쪽에 “export OMP_NUM_THREADS=4”를 적어 주셔야 합니다.
56 TACHYON_작업실행 OpenMPI 수행시 “cannot allocate memory for thread-local data: ABORT"와 같은 에러메시지가 출력이 됩니다. 어떻게 해야 하나요?
● openMPI의 경우 intra node간의 통신에서 shared memory 사용을 하지 않도록
실행을 하면 할당하고자 하는 메모리 사이즈를 매우 크게 줄일 수 있다고 알려져 있기에
다음과 같이 실행을 할 것을 권합니다.
mpirun -mca btl ^sm -np $NSLOTS …

또한 Infiniband가 shared receive queue(SRQ)를 사용하도록 아래와 같이
설정할 경우에도 메모리 사용량을 줄일 수 있습니다.
[newbie@tachyonc ~]# cat ~/.openmpi/mca-params.conf
btl_openib_warn_no_hca_params_found=0
btl_openib_use_srq=1 
55 TACHYON_작업실행 Script에서 #, #$, ##은 각각 어떤 의미인가요?
● - # : shell에서 실행 안 되는 주석 처리하는 라인을 의미
- #$ : shell에서는 주석 처리되지만 SGE에서 옵션으로 사용
- ## : shell과 SGE 모두에서 주석으로 처리
54 TACHYON_작업실행 Job Script에서 제일 마지막에 들어가는 “-cleanipcs”, “-exit 0”은 무엇을 의미합니까?
● cleanipcs : 병렬처리를 위해 사용되었던 메모리의 신호들은 제거하고 통신을 종료한다는 뜻입니다.
- exit 0 : 상태값 0을 가지고 shell을 종료한다는 의미입니다.
53 TACHYON_작업실행 MCNP을 SGE를 통해 실행할 때 input을 어떻게 주어야 하나요? ex) ./mcnp5.mpi i=inp01
● 아래와 같이 입력하셔서 submit 하시면 됩니다.
mpirun -machinefile $TMPDIR/machines -np $NSLOTS mcnp5.mpi i=inp01
52 TACHYON_작업실행 디버깅 노드에서 openmpi 사용시 경고 메시지가 출력됩니다.
● HCA parameter 관련하여 warning이 출력됩니다.
해결 방법은 mpirun 실행시 -mpa 옵션을 주어서 출력이 되지 않도록 할 수 있습니다.

● ex) mpirun -mca btl_openib_warn_no_hca_params_found 0 -np … 
51 TACHYON_작업실행 디버깅 노드에서 hybrid(MPI+OpenMP)사용시 노드당 스레드 개수는 어떻게 설정하나요?
● 사용자가 bash를 사용할 경우 홈 디렉토리에 있는 .bashrc파일 작업스크립트파일내에 “export OMP_NUM_THREADS = 스레드개수” 를 넣어주어야 합니다.
50 TACHYON_작업실행 MPI2 기능을 사용할 수 있나요?
● mpi 중 openmpi를 선택하시면 MPI2 루틴 사용이 가능합니다.
콘텐츠 만족도 조사

퀵메뉴

  • 사용안내
  • 슈퍼컴퓨팅 서비스
  • 슈퍼컴퓨팅 교육
  • PLSI
  • EDISON
  • 연구망
본문 처음으로 바로가기

KISITI 슈퍼컴퓨팅센터 대전광역시 유성구 과학로 335 한국과학기술정보연구원 문의 080-041-1991 / FAX 042-869-0569

Copyrightⓒ2012 KISTI SUPERCOMPUTION CENTER ALL RIGHTS RESERVED.

관련사이트 바로가기