Hi all,<br>&nbsp;&nbsp; this is the first time that i try to integrate MAUI and TORQUE on my HPC cluster (<a href="http://scilx.disco.unimib.it/">http://scilx.disco.unimib.it/</a>) following these instructions <a href="http://www.clusterresources.com/products/maui/docs/pbsintegration.shtml">http://www.clusterresources.com/products/maui/docs/pbsintegration.shtml</a>. <br>
<br>After I compiled the sources, when I run maui executable these errors appears..<br>
$ showq<br>
ERROR:&nbsp;&nbsp;&nbsp; lost connection to server<br>
ERROR:&nbsp;&nbsp;&nbsp; cannot request service (status)<br>
$ showconfig<br>
ERROR:&nbsp;&nbsp;&nbsp; lost connection to server<br>
ERROR:&nbsp;&nbsp;&nbsp; cannot request service (status)<br><br>TORQUE seems to work fine because ...<br><br>$ qstat -Q<br>Queue&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Max&nbsp;&nbsp; Tot&nbsp;&nbsp; Ena&nbsp;&nbsp; Str&nbsp;&nbsp; Que&nbsp;&nbsp; Run&nbsp;&nbsp; Hld&nbsp;&nbsp; Wat&nbsp;&nbsp; Trn&nbsp;&nbsp; Ext T<br>----------------&nbsp;&nbsp; ---&nbsp;&nbsp; ---&nbsp;&nbsp; ---&nbsp;&nbsp; ---&nbsp;&nbsp; ---&nbsp;&nbsp; ---&nbsp;&nbsp; ---&nbsp;&nbsp; ---&nbsp;&nbsp; ---&nbsp;&nbsp; --- -<br>
short&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp; yes&nbsp;&nbsp; yes&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0 E<br>long&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp; yes&nbsp;&nbsp; yes&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0 E<br>default&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp; yes&nbsp;&nbsp; yes&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0 R<br>
devel&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp; yes&nbsp;&nbsp; yes&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0 E<br>medium&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp; yes&nbsp;&nbsp; yes&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp; 0 E<br><br>$ pbsnodes -a<br>node01<br>&nbsp;&nbsp;&nbsp;&nbsp; state = free<br>&nbsp;&nbsp;&nbsp;&nbsp; np = 2<br>
&nbsp;&nbsp;&nbsp;&nbsp; properties = safe,sci2<br>&nbsp;&nbsp;&nbsp;&nbsp; ntype = cluster<br>&nbsp;&nbsp;&nbsp;&nbsp; status = opsys=linux,uname=Linux node01 2.6.22-3-686 #1 SMP Sun Feb 10 20:20:49 UTC 2008 i686,sessions=? 0,nsessions=? 0,nusers=0,idletime=790726,totmem=5132348kb,availmem=5024088kb,physmem=1035852kb,ncpus=? 0,loadave=0.00,netload=866968120,state=free,jobs=,varattr=,rectime=1211537417<br>
<br>node02<br>&nbsp;&nbsp;&nbsp;&nbsp; state = free<br>&nbsp;&nbsp;&nbsp;&nbsp; np = 2<br>&nbsp;&nbsp;&nbsp;&nbsp; properties = safe,sci2<br>&nbsp;&nbsp;&nbsp;&nbsp; ntype = cluster<br>&nbsp;&nbsp;&nbsp;&nbsp; status = opsys=linux,uname=Linux node02 2.6.22-3-686 #1 SMP Sun Feb 10 20:20:49 UTC 2008 i686,sessions=? 15201,nsessions=? 15201,nusers=0,idletime=791855,totmem=5132348kb,availmem=5087924kb,physmem=1035852kb,ncpus=? 15201,loadave=0.00,netload=3945631823,state=free,jobs=,varattr=,rectime=1211537434<br>
<br>node03<br>&nbsp;&nbsp;&nbsp;&nbsp; state = free<br>&nbsp;&nbsp;&nbsp;&nbsp; np = 2<br>&nbsp;&nbsp;&nbsp;&nbsp; properties = safe<br>&nbsp;&nbsp;&nbsp;&nbsp; ntype = cluster<br>&nbsp;&nbsp;&nbsp;&nbsp; status = opsys=linux,uname=Linux node03 2.6.22-3-686 #1 SMP Sun Feb 10 20:20:49 UTC 2008 i686,sessions=? 15201,nsessions=? 15201,nusers=0,idletime=792963,totmem=5132348kb,availmem=5089988kb,physmem=1035852kb,ncpus=? 15201,loadave=0.00,netload=3961890349,state=free,jobs=,varattr=,rectime=1211537435<br>
<br>node04<br>&nbsp;&nbsp;&nbsp;&nbsp; state = free<br>&nbsp;&nbsp;&nbsp;&nbsp; np = 2<br>&nbsp;&nbsp;&nbsp;&nbsp; properties = safe,sci2<br>&nbsp;&nbsp;&nbsp;&nbsp; ntype = cluster<br>&nbsp;&nbsp;&nbsp;&nbsp; status = opsys=linux,uname=Linux node04 2.6.22-3-686 #1 SMP Sun Feb 10 20:20:49 UTC 2008 i686,sessions=? 15201,nsessions=? 15201,nusers=0,idletime=792869,totmem=5132348kb,availmem=5045880kb,physmem=1035852kb,ncpus=? 15201,loadave=0.00,netload=3201185645,state=free,jobs=,varattr=,rectime=1211537435<br>
<br><br>For TORQUE 2.3.0 I compiled sources in this way:<br>$ ./configure --with-rcp=rcp<br>$ make<br>$ make packages<br>$ make install<br><br>For maui maui-3.2.6p19 I compiled sources in this way:<br>$ ./configure --with-pbs<br>
$ make<br>$ make install<br><br><div id="result_box" dir="ltr">Here&#39;s a pieceof /usr/local/maui/log/maui.log logfile....<br></div>05/23 12:02:43 INFO:&nbsp;&nbsp;&nbsp;&nbsp; connect request from <a href="http://10.0.1.1">10.0.1.1</a><br>
05/23 12:02:43 INFO:&nbsp;&nbsp;&nbsp;&nbsp; received service request from host &#39;<a href="http://scilx.disco.unimib.it">scilx.disco.unimib.it</a>&#39;<br>05/23 12:02:43 INFO:&nbsp;&nbsp;&nbsp;&nbsp; client socket from &#39;<a href="http://scilx.disco.unimib.it">scilx.disco.unimib.it</a>&#39; accepted<br>
05/23 12:02:43 UIProcessCommand(S)<br>05/23 12:02:43 MSURecvData(S,5000000,TRUE,SC,EMsg)<br>05/23 12:02:43 MSURecvPacket(7,BufP,9,NULL,5000000,SC)<br>05/23 12:02:43 MSURecvPacket(7,BufP,89,NULL,5000000,SC)<br>05/23 12:02:43 ALERT:&nbsp;&nbsp;&nbsp; checksum does not match (e4ce95d86901effd:5cb9b1121a647424)&nbsp; request &#39;TS=1211536963 AUTH=root DT=CMD=diagnose AUTH=root ARG=6 0 ALL [NONE]&#39;<br>
05/23 12:02:43 ALERT:&nbsp;&nbsp;&nbsp; cannot read client packet<br>05/23 12:02:43 MSUDisconnect(S)<br>05/23 12:02:50 INFO:&nbsp;&nbsp;&nbsp;&nbsp; connect request from <a href="http://10.0.1.1">10.0.1.1</a><br>05/23 12:02:50 INFO:&nbsp;&nbsp;&nbsp;&nbsp; received service request from host &#39;<a href="http://scilx.disco.unimib.it">scilx.disco.unimib.it</a>&#39;<br>
05/23 12:02:50 INFO:&nbsp;&nbsp;&nbsp;&nbsp; client socket from &#39;<a href="http://scilx.disco.unimib.it">scilx.disco.unimib.it</a>&#39; accepted<br>05/23 12:02:50 UIProcessCommand(S)<br>05/23 12:02:50 MSURecvData(S,5000000,TRUE,SC,EMsg)<br>
05/23 12:02:50 MSURecvPacket(7,BufP,9,NULL,5000000,SC)<br>05/23 12:02:50 MSURecvPacket(7,BufP,77,NULL,5000000,SC)<br>05/23 12:02:50 ALERT:&nbsp;&nbsp;&nbsp; checksum does not match (9639adad8f21204a:ab2d4857aea9a410)&nbsp; request &#39;TS=1211536970 AUTH=root DT=CMD=showconfig AUTH=root ARG=&#39;<br>
05/23 12:02:50 ALERT:&nbsp;&nbsp;&nbsp; cannot read client packet<br>05/23 12:02:50 MSUDisconnect(S)<br><br><br><div id="result_box" dir="ltr">And this is the configuration of pbs_server ...<br></div>set server scheduling = True<br>set server acl_hosts = <a href="http://scilx.disco.unimib.it">scilx.disco.unimib.it</a><br>
set server managers = <a href="mailto:root@scilx.disco.unimib.it">root@scilx.disco.unimib.it</a><br>set server operators = <a href="mailto:root@scilx.disco.unimib.it">root@scilx.disco.unimib.it</a><br>set server default_queue = default<br>
set server log_events = 511<br>set server mail_from = torque<br>set server query_other_jobs = True<br>set server scheduler_iteration = 30<br>set server node_check_rate = 60<br>set server tcp_timeout = 6<br>set server node_pack = True<br>
set server next_job_number = 10689<br><br><br>How I can resolve my problem?<br><br>Thanks a lot. Regards.<br><br>-- <br>Filippo Spiga<br>DISCo - FISLAB - Computational Physics and Complex Systems Laboratory<br>Rappresentante degli Studenti presso la FacoltÓ di Scienze Matematiche, Fisiche e Naturali<br>
UniversitÓ degli Studi di Milano-Bicocca<br>
mobile: +393408387735<br>Skype: filippo.spiga<br><br>C&#39;e&#39; un solo modo di dimenticare il tempo: impiegarlo.<br>        -- Baudelaire, &quot;Diari intimi&quot;