lcca

Laboratório de Computação Científica Avançada


Valid XHTML 1.0 Strict

Valid CSS!

Cluster Linux PUMA tux


IBM


O Cluster PUMA é constituido por 59 servidores DELL PowerEdge 1950, com 2 Xeon 5430 (8 cores de 2,66 GHz), 16 GB de RAM DDR2-FBDIMM 667 MHz, e com 300 GB de disco SAS cada.



_Fila____|_horas(cput)_|_recurso_por no__|_nos_
long     |     3000    | 8 cpu / 16GB    | 22 exclusivos 
special  |     1266    | 8 cpu / 16GB    | 12 exclusivos
batch    |     1500    | 8 cpu / 16GB    | 4 (13 cpus exclusivas)



Sistema de filas

torquePBS + Maui(escalonador)

 

Os seguintes comandos são úteis:
qstat -a (visualizar todos os jobs presentes no servidor)
qstat -q (exibir as filas existentes)
showq (situação dos jobs na fila)
checkjob (exibir a situação do job com identificação job_id)


Em /scratch/programas/intel/ serao encontrados todos os programas compilados com o icc e o ifort da intel.

Caso necessite, edite o seu ~/.bashrc para especificar variáveis de ambiente e faça o logout, pois elas serao recarregadas no próximo login

Use o mpi-selector-menu para escolher a implementação de MPI que desejas utilizar. Recomendamos openmi-1.4-O3-intel64-torque

Nao selecionem lam sob nenhuma hipótese

Grave todos os seus arquivos em /scracth/. Execute todos seus jobs a partir de diretorios dentro de /scracth/

Os codigos paralelos, aqueles que rodarao com mpirun no sistema de filas, deverao ser compilados com os compiladores "paralelos" correspondentes. Isto é, mpicc para C e mpif90 para fortran90, etc.

Cada usuário poderá ter 50 jobs rodando na fila long.

Para alterar a senha utilizem "yppasswd".

Exemplo de job OPENMPI
Exemplo de job MPICH2 - Caso tenha selecionado MPICH2 pelo mpi-selector-menu

Os seguintes links podem auxiliar a compreender o funcionamento dos comandos básicos.

http://www.adaptivecomputing.com/resources/docs/maui/mauiusers.php
http://www.clusterresources.com/torquedocs/2.1jobsubmission.shtml
http://www.clusterresources.com/torquedocs21/users/2.1jobsubmission.shtml
http://www.clusterresources.com/torquedocs21/users/2.2files.shtml
http://www.clusterresources.com/torquedocs21/users/2.3cancelingjobs.shtml
http://hpc.sissa.it/pbs/pbs-2.html (seção 2.1 até 2.13)
http://www.open-mpi.org/faq/?category=mpi-apps
https://computing.llnl.gov/tutorials/parallel_comp/
https://computing.llnl.gov/tutorials/linux_clusters/
http://www.advancedlinuxprogramming.com/alp-folder/
http://www.nas.nasa.gov/hecc/support/kb/Lustre-Best-Practices_226.html (considere que trabalhamos na puma com 02 OSS, cada um com 01 OST. O /scratch e o /puma_data utilizam o volume Lustre)


©2005 Universidade de São Paulo