Dear All,<br><br>&nbsp;I am performing a series tests on a RHEL-intel 4-core 2cpu workstation with ifort 9 and mpi-1.2.6.<br><br>A strange&nbsp; behavior is found for QE v4 when i carry out parallel executation.&nbsp; For example,&nbsp; i just ran the script supplied in $QE/example/example10. Using &#39;top&#39; command, i found load in each cpu is highly unbalanced :<br>
%cpu %mem<br>&nbsp; 151&nbsp; 0.2&nbsp;&nbsp; 0:20.38 pw.x&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; <br>&nbsp; 130&nbsp; 0.2&nbsp;&nbsp; 0:19.40 pw.x&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; <br>&nbsp; 103&nbsp; 0.2&nbsp;&nbsp; 0:19.99 pw.x&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; <br>&nbsp;&nbsp;&nbsp; 92&nbsp; 0.2&nbsp;&nbsp; 0:13.82 pw.x&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; <br>&nbsp;&nbsp;&nbsp; 81&nbsp; 0.2&nbsp;&nbsp; 0:17.89 pw.x&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; <br>
&nbsp;&nbsp;&nbsp; 79&nbsp; 0.2&nbsp;&nbsp; 0:14.01 pw.x&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; <br>&nbsp;&nbsp;&nbsp; 76&nbsp; 0.2&nbsp;&nbsp; 0:14.01 pw.x&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; <br>&nbsp;&nbsp; 74&nbsp; 0.2&nbsp;&nbsp; 0:14.02 pw.x <br>&nbsp;<br>But this situation doesnot happen when i try to run the same work with QE-v3.<br>Would you please give me some hints or suggestion to tune&nbsp; the performance for<br>
&nbsp;QE v4 ?<br>Thanks in advance, and best regards!<br><br>Hai-Ping<br clear="all"><br>-- <br>Hai-Ping Lan <br>Department of Electronics ,<br>Peking University , Bejing, 100871<br><a href="mailto:lanhaiping@gmail.com">lanhaiping@gmail.com</a>, <a href="mailto:hplan@pku.edu.cn">hplan@pku.edu.cn</a><br>