이제 munge 설치 이후 단계를 진행해보려 한다.
먼저 상태 확인인 것 같다.
munge -n | unmunge
위와 같이 나오는데 각 항목별 어떤걸 의미하는지는
항목 이름으로 대강 유추가 가능하다.
STATUS : 현재 상태겠지..?
ENCODE_HOST : 현재 내 시스템의 호스트 네임인 것 같다.
ENCODE_TIME, DECODE_TIME : 현재 시간인것 같다.
TTL : 내가 아는 TTL이면 Time To Live인데 숫자를 보니 맞는 것 같다. 여기서의 TTL은 노드간 이동 시 마다 1씩 차감하는건가..이것도 나중에 확인 해봐야겠다.
CIPHER : CHIP ID?일거 같은데 aes128은 암호화 기법인데, 정확히 뭘 뜻하는 건진 모르겠다.
MAC : 이것도 MAC Address겠지만, sha256도 암호화 기법이다..
ZIP : 이건 뭔지 정확히 모르겠다.
UID, GID는 내가 아는 것들인 것 같고,
LENGTH는 어떤 길이인건지..모르겠다.
대강 예상해보는건 이정도인데, 이게 맞는 건지는
나중에 설치가 다 끝나거나 진행하면서 확인이 가능하면 수정해보겠다.
그리고 나서는 Slurm configure 셋팅을 해줘야 하는 것 같은데,
/usr/share/doc/slurm-18.08.8/html/configurator.easy.html
웹 브라우저에서 해당 주소 치면 값 넣는 창이 나온다. 적절하게 넣어서 submit 해주면 되는 것 같다.
주위 할 점은 나는 slurm 버전이 다르기 때문에
/usr/share/doc/slurm-22.05.2/html/configurator.easy.html
버전에 맞게 해당 주소로 입력해야했다.
submit하고 나면
페이지가 바뀌고 내가 입력한 값들을 보여주는데
이 내용을 전체 복사해서
/etc/slurm/slurm.conf (ovewriting the old file)
위의 파일을 만들어 붙여넣기 한 후 저장해줘야 하는 것 같다.
journalctl -f
그리고 터미널을 하나 더 띄워서
위의 명령어를 쳐두고 작업을 하면
작업에 대한 로그가 터미널에 출력된다.
error 메시지 들도 다 찍히기 때문에
이때부터는 터미널을 2개 띄워놓고 작업을 했다.
다음 단계를 진행하는데 또 문제가 발생했다..
systemctl start slurmctld
# Check its status
systemctl status slurmctld
# If everything is fine, enabe it
systemctl enable slurmctld
해당 부분인데, 아래와 같은 에러가 발생한다.
slurmctld: error: This host (localhost/localhost.localdomain) not a valid controller
또 열심히 문제를 해결하기 위해 시행착오를 겪어야 할 것 같다..
다음글에서 이어가겠다..
'Cluster > Slurm' 카테고리의 다른 글
slurm computenode | sinfo: error: get_addr_info: getaddrinfo() failed: Name or service not known error (0) | 2023.09.11 |
---|---|
slurm 설치해보기(마무리_풀 설치과정) (0) | 2023.09.08 |
Slurm 설치해보기(2) (0) | 2023.08.08 |
Slurm 설치 해보기(1) (0) | 2023.08.07 |
Slurm (0) | 2023.07.31 |