<HTML dir=ltr><HEAD><TITLE>Re: [torqueusers] qsub: Bad UID for job execution</TITLE>
<META http-equiv=Content-Type content="text/html; charset=unicode">
<META content="MSHTML 6.00.6000.16981" name=GENERATOR></HEAD>
<BODY>
<DIV id=idOWAReplyText20373 dir=ltr>
<DIV dir=ltr><FONT face=Arial color=#000000 size=2>&gt; <FONT face="Times New Roman">At first I had /var/spool/pbs/server_name set to cluster.fing.edu.uy.</FONT></FONT></DIV>
<DIV dir=ltr><FONT face=Arial color=#000000 size=2><FONT face="Times New Roman">&gt; Now I changed it to pbs_oscar but had no luck, I keep getting the "Bad</FONT></FONT></DIV>
<DIV dir=ltr><FONT face=Arial color=#000000 size=2><FONT face="Times New Roman">&gt; UID for job execution" error.</FONT><BR></FONT></DIV>
<DIV dir=ltr><FONT face=Arial size=2>cluster.fing.edu.uy and node01 (a.k.a. pbs_oscar) are just different interfaces on the same node, correct?</FONT></DIV>
<DIV dir=ltr><FONT face=Arial size=2></FONT>&nbsp;</DIV>
<DIV dir=ltr><FONT face=Arial size=2>if so, when you run the command `/bin/hostname`, what do you get back?</FONT></DIV>
<DIV dir=ltr><FONT face=Arial size=2></FONT>&nbsp;</DIV>
<DIV dir=ltr><FONT face=Arial size=2>my experience with oscar is that `/bin/hostname` needs to return the name that is associated with the private IP addr (the same interface as pbs_oscar, oscar_server, nfs_oscar); if your hostname is returning as cluster.fing.edu.uy, that could be the problem you're running into.</FONT></DIV>
<DIV dir=ltr><FONT face=Arial size=2></FONT>&nbsp;</DIV>
<DIV dir=ltr><FONT face=Arial size=2>--Joe</FONT></DIV></DIV>
<DIV dir=ltr>
<DIV dir=ltr><BR></DIV>
<DIV dir=ltr>
<HR tabIndex=-1>
</DIV>
<DIV dir=ltr><FONT face=Tahoma size=2><B>From:</B> torqueusers-bounces@supercluster.org on behalf of Santiago Iturriaga<BR><B>Sent:</B> Sat 3/27/2010 10:16 PM<BR><B>To:</B> torqueusers@supercluster.org<BR><B>Subject:</B> Re: [torqueusers] qsub: Bad UID for job execution<BR></FONT><BR></DIV></DIV>
<DIV>
<P><FONT size=2>/etc/hosts contains the following:<BR><BR>[siturria@cluster ~]$ cat /etc/hosts<BR># Do not remove the following line, or various programs<BR># that require network functionality will fail.<BR>::1&nbsp;&nbsp;&nbsp;&nbsp; localhost.localdomain&nbsp;&nbsp; localhost<BR>192.168.242.20&nbsp; node20.cluster.fing&nbsp;&nbsp;&nbsp;&nbsp; node20<BR>192.168.242.19&nbsp; node19.cluster.fing&nbsp;&nbsp;&nbsp;&nbsp; node19<BR>192.168.242.18&nbsp; node18.cluster.fing&nbsp;&nbsp;&nbsp;&nbsp; node18<BR>192.168.242.17&nbsp; node17.cluster.fing&nbsp;&nbsp;&nbsp;&nbsp; node17<BR>192.168.242.16&nbsp; node16.cluster.fing&nbsp;&nbsp;&nbsp;&nbsp; node16<BR>192.168.242.15&nbsp; node15.cluster.fing&nbsp;&nbsp;&nbsp;&nbsp; node15<BR>192.168.242.14&nbsp; node14.cluster.fing&nbsp;&nbsp;&nbsp;&nbsp; node14<BR>192.168.242.13&nbsp; node13.cluster.fing&nbsp;&nbsp;&nbsp;&nbsp; node13<BR>192.168.242.12&nbsp; node12.cluster.fing&nbsp;&nbsp;&nbsp;&nbsp; node12<BR>192.168.242.11&nbsp; node11.cluster.fing&nbsp;&nbsp;&nbsp;&nbsp; node11<BR>192.168.242.10&nbsp; node10.cluster.fing&nbsp;&nbsp;&nbsp;&nbsp; node10<BR>192.168.242.9&nbsp;&nbsp; node09.cluster.fing&nbsp;&nbsp;&nbsp;&nbsp; node09<BR>192.168.242.8&nbsp;&nbsp; node08.cluster.fing&nbsp;&nbsp;&nbsp;&nbsp; node08<BR>192.168.242.7&nbsp;&nbsp; node07.cluster.fing&nbsp;&nbsp;&nbsp;&nbsp; node07<BR>192.168.242.6&nbsp;&nbsp; node06.cluster.fing&nbsp;&nbsp;&nbsp;&nbsp; node06<BR>192.168.242.5&nbsp;&nbsp; node05.cluster.fing&nbsp;&nbsp;&nbsp;&nbsp; node05<BR>192.168.242.4&nbsp;&nbsp; node04.cluster.fing&nbsp;&nbsp;&nbsp;&nbsp; node04<BR>192.168.242.3&nbsp;&nbsp; node03.cluster.fing&nbsp;&nbsp;&nbsp;&nbsp; node03<BR>192.168.242.2&nbsp;&nbsp; node02.cluster.fing&nbsp;&nbsp;&nbsp;&nbsp; node02<BR>192.168.242.1&nbsp;&nbsp; node01.cluster.fing&nbsp;&nbsp;&nbsp;&nbsp; node01&nbsp; oscar_server&nbsp;&nbsp;&nbsp;<BR>nfs_oscar&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; pbs_oscar<BR>164.73.47.186&nbsp;&nbsp; cluster.fing.edu.uy&nbsp;&nbsp;&nbsp;&nbsp; cluster<BR><BR>At first I had /var/spool/pbs/server_name set to cluster.fing.edu.uy.<BR>Now I changed it to pbs_oscar but had no luck, I keep getting the "Bad<BR>UID for job execution" error.<BR><BR><BR>El 26/03/2010 12:17 p.m., Arnau Bria escribió:<BR>&gt; On Fri, 26 Mar 2010 11:31:34 +0000<BR>&gt; Santiago Iturriaga wrote:<BR>&gt;<BR>&gt; Hi Santiago,<BR>&gt;<BR>&gt; what's the content of /etc/hosts?<BR>&gt; Seems to me that torque is considering your server names as diff hosts,<BR>&gt; and confused about primary name server.<BR>&gt;<BR>&gt; *as simple test, try adding them to /etc/hosts.equiv. Not sure how R*<BR>&gt; commands will behave between diff hostnames in same host.<BR>&gt;<BR>&gt; HTH,<BR>&gt; Arnau<BR>&gt; _______________________________________________<BR>&gt; torqueusers mailing list<BR>&gt; torqueusers@supercluster.org<BR>&gt; <A href="http://www.supercluster.org/mailman/listinfo/torqueusers">http://www.supercluster.org/mailman/listinfo/torqueusers</A><BR>&gt;&nbsp;&nbsp;&nbsp;<BR><BR>_______________________________________________<BR>torqueusers mailing list<BR>torqueusers@supercluster.org<BR><A href="http://www.supercluster.org/mailman/listinfo/torqueusers">http://www.supercluster.org/mailman/listinfo/torqueusers</A><BR></FONT></P></DIV></BODY></HTML>