All,<div><br></div><div>TORQUE 4.0 is officially here! Please check out Adaptive Computing&#39;s official announcement here: <a href="http://www.adaptivecomputing.com/adaptive-computing-offers-the-next-generation-of-high-performance-computing-with-moab-hpc-suite-7-0/" target="_blank">http://www.adaptivecomputing.com/adaptive-computing-offers-the-next-generation-of-high-performance-computing-with-moab-hpc-suite-7-0/</a></div>
<div><br></div><div>The tarball can be downloaded from here: <a href="http://www.adaptivecomputing.com/resources/downloads/torque/torque-4.0.0.tar.gz">http://www.adaptivecomputing.com/resources/downloads/torque/torque-4.0.0.tar.gz</a> </div>
<div><br></div><div>We have several sites currently using 4.0 and feedback has been positive. These warnings are posted on the download site, but I am copying them here:</div><div><br></div><div>1. Make sure that you have openssl-devel (RedHat based) / libssl-dev (Debian based) installed (the name may differ for different operating systems) in order to be able to build TORQUE 4.0.<br>
</div><div><div><div>2. Make sure that you run the daemon trqauthd on machines that will be running client commands. NOTE: there is an init.d script for it in contrib/init.d/ but it needs customization (this includes Moab). One problem is that it has a misspelling for PBS_DAEMON - it should be   /usr/local/sbin/trqauthd by default, not /usr/local/bin/trqauthd.</div>
<div>3. Moab needs to be started or restarted after installing TORQUE 4.0 (if you are using Moab)</div></div><div><br></div><div>Please make sure to take all normal precautions for upgrading. Another advisory (not on the website) is that TORQUE now uses hwloc to manage cpusets, meaning you will need to install hwloc on your system if it isn&#39;t already there and you wish to use it. It needs to be version 1.1 or higher.</div>
<div><br></div><div>The major features of the release are briefly described on the release, but the CHANGELOG for 4.0 is copied at the end of this email. </div><div><br></div><div>This release has undergone more testing than any previous release of TORQUE; to be fair, it also has more changes than any previous version of TORQUE. Overall, we saw very good results in our beta program and most of the sites using it have had good experiences. We are proud of the quality of this release and hope that you&#39;ll try it out and let us know how it works for you.</div>
<div><br></div>-- <br><div>David Beer | Software Engineer</div><div>Adaptive Computing</div><div><br></div><div><br></div><div><div>4.0.0</div><div>  e - make a threadpool for TORQUE server. The number of threads is</div>
<div>      customizable using min_threads and max_threads, and idle time before</div><div>      exiting can be set using thread_idle_seconds.</div><div>  e - make pbs_server multi-threaded in order to increase responsiveness and scalability.</div>
<div>  e - remove the forking from pbs_server running a job, the thread handling the request just</div><div>      waits until the job is run.</div><div>  e - change qdel to simply send qdel all - previously this was executed by a qstat and a qdel</div>
<div>      of every individual job</div><div>  e - no longer fork to send mail, just use a thread</div><div>  e - use hwloc as the backbone for cpuset support in TORQUE (contributed by Dr. Bernd Kallies)</div><div>  e - add the boolean variable $use_smt to mom config. If set to false, this skips logical</div>
<div>      cores and uses only physical cores for the job. It is true by default.</div><div>      (contributed by Dr. Bernd Kallies)</div><div>  n - with the multi-threading the pbs_server -t create and -t cold commands could no longer</div>
<div>      ask for user input from the command line. The call to ask if the user wants to continue</div><div>      was moved higher in the initialization process and some of the wording changed to</div><div>      reflect what is now happening.</div>
<div>  e - if cpusets are configured but aren&#39;t found and cannot be mounted, pbs_mom will now fail to</div><div>      start instead of failing silently.</div><div>  e - Change node_spec from an N^2 (but average 5N) algorithm to an N algorithm with respect</div>
<div>      to nodes. We only loop over each node once at a maximum.</div><div>  e - Abandon pbs_iff in favor of trqauthd. trqauthd is a daemon to be started once that can</div><div>      perform pbs_iff&#39;s functionality, increasing speed and enabling future security</div>
<div>      enhancements</div><div>  e - add mom_hierarchy functionality for reporting. The file is located in</div><div>      &lt;TORQUE_HOME&gt;/server_priv/mom_hierarchy, and can be written to tell moms to send</div><div>
      updates to other moms who will pass them on to pbs_server. See docs for details</div><div>  e - add a unit testing framework (check). It is compiled with --with-check and tests</div><div>      are executed using make check. The framework is complete but not many tests have</div>
<div>      been written as of yet.</div><div>  e - Mom rejection messages are now passed back to qrun when possible</div><div>  e - Added the option -c for startup. By default, the server attempts to send the mom</div><div>
      hierarchy file to all moms on startup, and all moms update the server and request</div><div>      the hierarchy file. If both are trying to do this at once, it can cause a lot of</div><div>      traffic. -c tells pbs_server to wait 10 minutes to attempt to contact moms that</div>
<div>      haven&#39;t contacted it, reducing this traffic.</div><div>  e - Added mom parameter -w to reduce start times. This parameter wait to send it&#39;s</div><div>      first update until the server sends it the mom hierarchy file, or until 10</div>
<div>      minutes have passed. This should reduce large cluster startup times.</div></div><br>
</div>