Objet : Developers list for StarPU
Archives de la liste
- From: Mathieu Faverge <mathieu.faverge@inria.fr>
- To: Samuel Thibault <samuel.thibault@inria.fr>, starpu-devel@lists.gforge.inria.fr, Tony Delarue <tdelarue@enseirb-matmeca.fr>, Pierre Ramet <ramet@labri.fr>
- Subject: Re: [Starpu-devel] Question sur les data partition
- Date: Sun, 24 Feb 2019 21:55:46 +0100
- List-archive: <http://lists.gforge.inria.fr/pipermail/starpu-devel/>
- List-id: "Developers list. For discussion of new features, code changes, etc." <starpu-devel.lists.gforge.inria.fr>
Ok, je pense avoir trouvé le souci:
int starpu_mpi_wait_for_all(MPI_Comm comm)
{
int mpi = 1;
int task = 1;
while (task || mpi)
{
task = _starpu_task_wait_for_all_and_return_nb_waited_tasks();
mpi = _starpu_mpi_barrier(comm);
}
return 0;
}
La boucle while me parait un peu douteuse si jamais la valeure de retour des deux fonctions est locale. Nottament la valeure retournée par le premier appel. Du coup, j'ai un process qui rerentre dedans, alors qu ele deuxième non.
Du coup, j'ai remplacé par:
starpu_task_wait_for_all();
starpu_mpi_barrier( pastix_data->inter_node_comm );
Mais je ne sais pas si c'est suffisant vu la boucle plus haut.
@+
Mathieu
Le 24/02/2019 à 21:10, Mathieu Faverge a écrit :
Effectivement, c'est mieux que ma solution :).
Maintenant j'ai autre souci, je sais pas si l'un de vous a déjà vu çà sur plafrim. J'ai une désynchronisation de manière aléatoire dans mes barrières mpi. Un coup tout va bien. Le coup d'apres un noeud prend une barrière d'avance sur l'autre.
@+
Mathieu
Le 24/02/2019 à 20:46, Samuel Thibault a écrit :
Mathieu Faverge, le dim. 24 févr. 2019 18:23:14 +0100, a ecrit:
Bon ben il suffisait d'envoyer un message pour percuter ou était leAh, mais tu veux plutôt dire: les handles fils héritent du pointeur
problème. :P
En fait, je ne fais qu'écraser les précédents tags, sachant que les
partitions héritent du tag de leur donnée parente et du coup c'est ce qui
pose problème, car dans starpu_mpi_data_register_comm, on récupère la
structure pour stocker le tag et on la met à jour au lieu d'en créer une
nouvelle.
mpi_data du père ? On ne devrait pas, en effet. Dans
src/datawizard/filters.c: child->mpi_data = initial_handle->mpi_data;
Mets-le plutôt à NULL.
Samuel
--
--
Mathieu Faverge
Maitre de conférence / Associate Professor
Institut Polytechnique de Bordeaux - ENSEIRB-Matmeca
INRIA Bordeaux - Sud-Ouest, HiePACS Team
200 avenue de la vielle tour
33405 Talence Cedex
Phone: (+33) 5 24 57 40 73
- [Starpu-devel] Question sur les data partition, Mathieu Faverge, 23/02/2019
- Re: [Starpu-devel] Question sur les data partition, Samuel Thibault, 24/02/2019
- Re: [Starpu-devel] Question sur les data partition, Samuel Thibault, 24/02/2019
- Re: [Starpu-devel] Question sur les data partition, Mathieu Faverge, 24/02/2019
- Re: [Starpu-devel] Question sur les data partition, Mathieu Faverge, 24/02/2019
- Re: [Starpu-devel] Question sur les data partition, Mathieu Faverge, 24/02/2019
- Re: [Starpu-devel] Question sur les data partition, Samuel Thibault, 24/02/2019
- Re: [Starpu-devel] Question sur les data partition, Mathieu Faverge, 24/02/2019
- Re: [Starpu-devel] Question sur les data partition, Mathieu Faverge, 24/02/2019
- Re: [Starpu-devel] Question sur les data partition, Samuel Thibault, 26/02/2019
- Re: [Starpu-devel] Question sur les data partition, Mathieu Faverge, 24/02/2019
- Re: [Starpu-devel] Question sur les data partition, Samuel Thibault, 24/02/2019
- Re: [Starpu-devel] Question sur les data partition, Mathieu Faverge, 24/02/2019
- Re: [Starpu-devel] Question sur les data partition, Samuel Thibault, 24/02/2019
- Re: [Starpu-devel] Question sur les data partition, Samuel Thibault, 24/02/2019
Archives gérées par MHonArc 2.6.19+.