|
Cluster Linux PUMA 

|
O Cluster PUMA é constituido por 59 servidores DELL PowerEdge 1950, com 2 Xeon 5430 (8 cores de 2,66 GHz), 16 GB de RAM DDR2-FBDIMM 667 MHz, e com 300 GB de disco SAS cada.
_Fila____|_horas(cput)_|_recurso_por no__|_nos_
long | 3000 | 8 cpu / 16GB | 22 exclusivos
special | 1266 | 8 cpu / 16GB | 12 exclusivos
batch | 1500 | 8 cpu / 16GB | 4 (13 cpus exclusivas)
|
Sistema de filas
torquePBS + Maui(escalonador)
Os seguintes comandos são úteis:
qstat -a (visualizar todos os jobs presentes no servidor)
qstat -q (exibir as filas existentes)
showq (situação dos jobs na fila)
checkjob (exibir a situação do job com identificação job_id)
Em /scratch/programas/intel/ serao encontrados todos os programas compilados com o icc e o ifort da intel.
Caso necessite, edite o seu ~/.bashrc para especificar variáveis de ambiente e faça o logout, pois elas serao recarregadas no próximo login
Use o mpi-selector-menu para escolher a implementação de MPI que desejas utilizar. Recomendamos openmi-1.4-O3-intel64-torque
Nao selecionem lam sob nenhuma hipótese
Grave todos os seus arquivos em /scracth/. Execute todos seus jobs a partir de diretorios dentro de /scracth/
Os codigos paralelos, aqueles que rodarao com mpirun no sistema de filas, deverao ser compilados com os compiladores "paralelos" correspondentes. Isto é, mpicc para C e mpif90 para fortran90, etc.
Cada usuário poderá ter 50 jobs rodando na fila long.
Para alterar a senha utilizem "yppasswd".
Exemplo de job OPENMPI
Exemplo de job MPICH2 - Caso tenha selecionado MPICH2 pelo mpi-selector-menu
Os seguintes links podem auxiliar a compreender o funcionamento dos comandos básicos.
http://www.adaptivecomputing.com/resources/docs/maui/mauiusers.php
http://www.clusterresources.com/torquedocs/2.1jobsubmission.shtml
http://www.clusterresources.com/torquedocs21/users/2.1jobsubmission.shtml
http://www.clusterresources.com/torquedocs21/users/2.2files.shtml
http://www.clusterresources.com/torquedocs21/users/2.3cancelingjobs.shtml
http://hpc.sissa.it/pbs/pbs-2.html (seção 2.1 até 2.13)
http://www.open-mpi.org/faq/?category=mpi-apps
https://computing.llnl.gov/tutorials/parallel_comp/
https://computing.llnl.gov/tutorials/linux_clusters/
http://www.advancedlinuxprogramming.com/alp-folder/
http://www.nas.nasa.gov/hecc/support/kb/Lustre-Best-Practices_226.html (considere que trabalhamos na puma com 02 OSS, cada um com 01 OST. O /scratch e o /puma_data utilizam o volume Lustre)
|