<br><br><div class="gmail_quote">---------- Forwarded message ----------<br>From: <b class="gmail_sendername">Daniel Kidger</b> <span dir="ltr"><<a href="mailto:daniel.kidger@googlemail.com">daniel.kidger@googlemail.com</a>></span><br>
Date: 19 August 2010 10:50<br>Subject: Re: [padb-users] Error message from /opt/sbin/libexec/minfo: No DLL to load<br>To: Ashley Pittman <<a href="mailto:ashley@pittman.co.uk">ashley@pittman.co.uk</a>><br><br><br>Ashley,<div class="im">
<br><br><span style="color: rgb(102, 51, 0);">>As a final point debugging collectives can be hard, in a deadlock 
situation it can be hard to tell if all >ranks are on the same iteration 
or if some are ahead of others and some are behind, I have a >patch to 
Open-MPI to add a counter to all collective calls to allow this 
situation to be detected and >reported correctly, if you're still stuck 
even with the stack trace then you might find this of use.  It'll >mean 
patching you MPI build and fixing the above problem with the DLL.</span><br><br></div>I would be particularly interested in this patch.<br>Albeit it is often further complicated in that with the code I am working on often calls collectives like MPI_Allgather from various subsets of MPI_COMM_WORLD such that I do no expect all process to have called it the same number of times - does your patch allow for this?<br>

<br>Daniel<br><br><br>Dr. Dan Kidger<br>Bull UK<br>
</div><br>