<br><font size=2 face="Arial">The off the cuff answer is that there might
be a problem with the rsh/ssh permissions on the system. &nbsp;Have you
verified that the user submitting the job (administrator@babbage) can do
a passwordless ssh (assuming you configured with --with-scp) to the compute
nodes and back to the headnode.</font>
<br>
<br><font size=2 face="Arial">For the test echo 'hostname' | qsub are you
getting stdout and stderror files back? (STDIN.e123456 looking things)?
&nbsp;If you are, is there anything in them? &nbsp;Is the administrator
getting an email about these jobs with any information in them? &nbsp;</font>
<br>
<br><font size=2 face="Arial">A seperate issue with python that I have
run into is ensuring that the 'all set' python setup includes PYTHONPATH
being set appropriately in the shell that torque opens, if you have installed
extra packages. &nbsp;But any problems here should show up in a stack trace
in the stderror file and can be diagnosed that way.</font>
<br>
<br><font size=2 face="Arial">Hope that gives you a start,</font>
<br><font size=2 face="Arial">Nate</font>
<br>
<br>
<br>
<br>
<br>
<table width=100%>
<tr valign=top>
<td width=40%><font size=1 face="sans-serif"><b>aohara@haverford.edu</b>
</font>
<br><font size=1 face="sans-serif">Sent by: torqueusers-bounces@supercluster.org</font>
<p><font size=1 face="sans-serif">26-Mar-2007 17:48</font>
<td width=59%><font size=1 face="sans-serif">&nbsp; &nbsp; &nbsp; &nbsp;
</font>
<table width=100%>
<tr valign=top>
<td>
<div align=right><font size=1 face="sans-serif">To</font></div>
<td><font size=1 face="sans-serif">torqueusers@supercluster.org</font>
<tr valign=top>
<td>
<div align=right><font size=1 face="sans-serif">cc</font></div>
<td>
<tr valign=top>
<td>
<div align=right><font size=1 face="sans-serif">Subject</font></div>
<td><font size=1 face="sans-serif">[torqueusers] Trouble running jobs with
TORQUE</font></table>
<br>
<table>
<tr valign=top>
<td>
<td></table>
<br></table>
<br>
<br>
<br><tt><font size=2>Hi,<br>
We just recently began setting up a linux cluster here at Haverford<br>
College using TORQUE and Maui. &nbsp;The general specs are 6 blades with
two<br>
dual core AMD opterons, 16 gb ram, and a head node with a similar<br>
processor setup.<br>
Over the past week, we installed TORQUE (and Maui), however TORQUE seems<br>
to be having trouble running jobs.<br>
Running 'pbsnodes -a' reports correctly on the state of all nodes and if<br>
neither pbs_sched or Maui are running then qstat shows jobs labeled Q,
as<br>
expected. &nbsp;However, when either pbs_sched or Maui are running, the
jobs<br>
don't seem to be running properly. &nbsp;I tried submitting both the test<br>
phrase `echo &quot;sleep 30&quot; | qsub' and a script `qsub testjob' where
testjob<br>
is a script containing `python myprogram.py'. &nbsp;All necessary python<br>
packages are installed too, so I know this isn't the problem (I've<br>
manually ran the python code on all nodes). &nbsp;The reason I suspect
some<br>
form of TORQUE error is that this job also completes immediately, even
tho<br>
it should take roughly 20 minutes to run. &nbsp;The tracejob output for
one is<br>
here (both are basically the same though):<br>
<br>
03/26/2007 17:25:17 &nbsp;S &nbsp; &nbsp;enqueuing into batch, state 1
hop 1<br>
03/26/2007 17:25:17 &nbsp;S &nbsp; &nbsp;Job Queued at request of administrator@babbage,<br>
owner<br>
 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;
&nbsp; &nbsp; &nbsp;= administrator@babbage, job name = testjob.sh,<br>
queue<br>
 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;
&nbsp; &nbsp; &nbsp;= batch<br>
03/26/2007 17:25:18 &nbsp;S &nbsp; &nbsp;Job Modified at request of root@babbage<br>
03/26/2007 17:25:18 &nbsp;S &nbsp; &nbsp;Job Run at request of root@babbage<br>
03/26/2007 17:25:18 &nbsp;S &nbsp; &nbsp;Job Modified at request of root@babbage<br>
03/26/2007 17:25:18 &nbsp;S &nbsp; &nbsp;Exit_status=-1<br>
03/26/2007 17:25:18 &nbsp;S &nbsp; &nbsp;Post job file processing error<br>
03/26/2007 17:25:18 &nbsp;S &nbsp; &nbsp;dequeuing from batch, state COMPLETE<br>
<br>
Any help would be greatly appreciated, thanks. &nbsp;If you need any more<br>
information about our cluster hardward/software setup just ask.<br>
<br>
Thanks,<br>
Andy O'Hara<br>
Haverford College Physics '09<br>
_______________________________________________<br>
torqueusers mailing list<br>
torqueusers@supercluster.org<br>
http://www.supercluster.org/mailman/listinfo/torqueusers<br>
<br>
</font></tt>
<br>