Enunciado TPP2: MPI Divisão e Conquista (D&C)

O objetivo do trabalho é implementar, usando a biblioteca MPI, uma versão paralela seguindo o modelo divisão e conquista, de um programa que ordena um grande vetor usando o algortimo Bubble Sort (o programa sequencial está no final desta especificação) e qsort. Após implementado, o programa deve ser executado no cluster GRAD com até 2 nós para realização das medições de desempenho para um vetor de 1.000.000 de elementos. Cada grupo (de no máximo dois integrantes) deve entregar um relatório em .pdf de uma página com a análise dos resultados e uma página com o código (seguir modelo proposto).

O nó raiz da árvore verifica se o vetor inicial será dividido ou conquistado. A verificação da condição de conquista é uma comparação com um valor fixo, para o vetor com 40 elementos pode ser por exemplo <= 10 (assim o algoritmo só desce 2 níveis da árvore binária e se utiliza dos 7 processadores alocados). Se for dividido, cada filho da árvore binária recebe uma metade do vetor. Por sua vez, cada filho verifica se ira conquistar ou novamente dividir o vetor. Quando as folhas da árvore decidirem que o vetor já está pequeno o bastante para ser conquistado, o vetor é ordenado com o algoritmo de Bubble Sort (código abaixo) e devolvido para o respectivo pai. O pai por sua vez, intercala os dois vetores recebidos (código sequencial abaixo) e devolve ao seu pai, até que o nó folha restabeleça o vetor original ordenado (Figura 1).

Para ordenar um vetor de 1.000.000 de elementos com um processo rodando em núcleo na GRAD o algoritmo de ordenação troca simples (bs) abaixo precisou de 74 minutos. Para 3 processos (um raiz e dois filhos) rodando em 3 núcleos precisou de 18 minutos.

Os itens para avaliação são:

execução da versão sequencial do algoritmo Bubble Sort e qsort para o vetor inteiro (inicializar com dados em ordem decrescente);
implementação da versão paralela SPMD do algoritmo MPI descrito acima seguindo o modelo divisão e conquista;
medição dos tempos de execução para a versão sequencial em uma máquina qualquer do aluno ou laboratório e da versão paralela para 1.000.000 de elementos (usando 2 nós exclusivos da máquina GRAD totalizando15 processadores - cada nó possui 8 processadores físicos);
cálculo do speed up e da eficiência para os casos de teste;
análise do balanceamento da carga na execução do programa paralelo nos diferentes níveis da árvore;
análise do ganho obtido com HT;
análise do ganho obtido com o balanceamento de carga (técnica sem alteração de código);
clareza do código (utilização de comentários e nomes de variáveis adequadas);
relatório no formato .pdf com uma página (coluna dupla) com código em anexo, seguindo as recomendações fornecidas no moodle

Código do algoritmo Bubble Sort

#include <stdio.h>
#include <stdlib.h>

#define DEBUG 1            // comentar esta linha quando for medir tempo
#define ARRAY_SIZE 40      // trabalho final com o valores 10.000, 100.000, 1.000.000

void bs(int n, int * vetor)
{
    int c=0, d, troca, trocou =1;

    while (c < (n-1) & trocou )
        {
        trocou = 0;
        for (d = 0 ; d < n - c - 1; d++)
            if (vetor[d] > vetor[d+1])
                {
                troca      = vetor[d];
                vetor[d]   = vetor[d+1];
                vetor[d+1] = troca;
                trocou = 1;
                }
        c++;
        }
}

int main()
{
    int vetor[ARRAY_SIZE];
    int i;

    for (i=0 ; i<ARRAY_SIZE; i++)              /* init array with worst case for sorting */
        vetor[i] = ARRAY_SIZE-i;
   

    #ifdef DEBUG
    printf("\nVetor: ");
    for (i=0 ; i<ARRAY_SIZE; i++)              /* print unsorted array */
        printf("[%03d] ", vetor[i]);
    #endif

    bs(ARRAY_SIZE, vetor);                     /* sort array */


    #ifdef DEBUG
    printf("\nVetor: ");
    for (i=0 ; i<ARRAY_SIZE; i++)                              /* print sorted array */
        printf("[%03d] ", vetor[i]);
    #endif

    return 0;
}

Rotina de Intercalação

/* recebe um ponteiro para um vetor que contem as mensagens recebidas dos filhos e            */
/* intercala estes valores em um terceiro vetor auxiliar. Devolve um ponteiro para este vetor */
 
int *interleaving(int vetor[], int tam)
{
	int *vetor_auxiliar;
	int i1, i2, i_aux;

	vetor_auxiliar = (int *)malloc(sizeof(int) * tam);

	i1 = 0;
	i2 = tam / 2;

	for (i_aux = 0; i_aux < tam; i_aux++) {
		if (((vetor[i1] <= vetor[i2]) && (i1 < (tam / 2)))
		    || (i2 == tam))
			vetor_auxiliar[i_aux] = vetor[i1++];
		else
			vetor_auxiliar[i_aux] = vetor[i2++];
	}

	return vetor_auxiliar;
}

Chamada para a rotina de Intercalação

int *vetor_auxiliar;         /* ponteiro para o vetor resultantes que sera alocado dentro da rotina */
vetor_aux = interleaving(vetor, tam);

Pseudocódigo D&C (versão desbalanceada)

MPI_Init();
my_rank = MPI_Comm_rank();  // pega pega o numero do processo atual (rank)

// recebo vetor
if ( my_rank != 0 )
   {
   MPI_Recv ( vetor, pai);                       // não sou a raiz, tenho pai
   MPI_Get_count(&Status, MPI_INT, &tam_vetor);  // descubro tamanho da mensagem recebida
   }
else
   {
   tam_vetor = VETOR_SIZE;               // defino tamanho inicial do vetor
   Inicializa ( vetor, tam_vetor );      // sou a raiz e portanto gero o vetor - ordem reversa
   }

// dividir ou conquistar?
if ( tam_vetor <= delta )
   BubbleSort (vetor);  // conquisto
else {
    // dividir
    // quebrar em duas partes e mandar para os filhos

    MPI_Send ( &vetor[0], filho esquerda, tam_vetor/2 );  // mando metade inicial do vetor
    MPI_Send ( &vetor[tam_vetor/2], filho direita , tam_vetor/2 );  // mando metade final

    // receber dos filhos

    MPI_Recv ( &vetor[0], filho esquerda);            
    MPI_Recv ( &vetor[tam_vetor/2], filho direita);   

    // intercalo vetor inteiro
 
    Intercala ( vetor );
    }

// mando para o pai

if ( my_rank !=0 )
   MPI_Send ( vetor, pai, tam_vetor );  // tenho pai, retorno vetor ordenado pra ele
else
   Mostra ( vetor );                    // sou o raiz, mostro vetor

MPI_Finalize();

Instalação do OpenMPI no Ubuntu 20.04

$ sudo apt-get update -y

$ sudo apt-get install -y openmpi-bin

Configuração Eclipse para C/C++

$ whereis openmpi
openmpi: /usr/lib/x86_64-linux-gnu/openmpi /etc/openmpi /usr/share/openmpi

OpenMPI path: /usr/lib/x86_64-linux-gnu/openmpi/include

Exemplos de compilação e execução

Compilação C em máquina local: gcc sequential.c -o sequential.o

Execução C em máquina local: ./sequential.o

Compilação MPI em máquina local: mpicc parallel_slave.c -o parallel_bs.o

Execução MPI em máquina local: mpirun --hostfile ./hostfile -np 4 ./parallel_bs.o

Execução no lad: ladrun -np 16 ./parallel_bs.o

Execução no lad: ladrun -np 32 ./parallel_bs.o

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
images		images
src		src
.gitignore		.gitignore
LICENSE		LICENSE
Makefile		Makefile
README.md		README.md
hostfile		hostfile

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Enunciado TPP2: MPI Divisão e Conquista (D&C)

Instalação do OpenMPI no Ubuntu 20.04

Configuração Eclipse para C/C++

Exemplos de compilação e execução

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Enunciado TPP2: MPI Divisão e Conquista (D&C)

Instalação do OpenMPI no Ubuntu 20.04

Configuração Eclipse para C/C++

Exemplos de compilação e execução

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages