PRAKTISKE ERFARINGER MED CRAY...
Transcript of PRAKTISKE ERFARINGER MED CRAY...
Omtale af mikrodatamater
En række af de mikrodatamater, som specielt har interesse for UNI-C's brugere, og som er opstiIlet i centerets demonstrationslokale for mikrodatamater , har igennem tiden været omtalt her i Kontakt (tidligere RECKUNYT). Her følger en oversigt over, hvilke numre, der har været tale om:
Sperry PC Apple Macintosh RC Partner Olivetti M24 Scandis IBM PC og AT NCR 4i
12
: RECKU NYT 139. : RECKU NYT 139. : RECKU NYT 140. : RECKU NYT 141. : RECKU NYT 143. : RECKU NYT 146. : RECKU NYT 147.
Per Andersen
lIlL
Mikrodatamatvagten etableret igen
Efter en periode, hvor mikrodatamat-gruppen ikke har haft den daglige vagt i vores demonstrationslokale og telefonvagt, er denne ordning nu etableret igen.
Fremover vil der hver dag mellem 15.00 og 16.00 være en person fra mikrodatamat-gruppen til stede i demonstrationslokalet med mikrodatamater på I. sal. Vagten vil være i stand til at gi ve »førstehjælp« i form af kort vejledning til de enkelte maskiner. Desuden vil der hos vagten kunne træffes aftale om konsulentassistanee fra faggruppens medlemmer.
Ligeledes er telefonvagten igen etableret. Det bet yder , at telefoniske henvendeh,er til mikrodatamat-gruppen bedes foretaget daglig mellem kl. 15.00 og 16.30.
Per Andersen
KONTAKT - nr. 2 - april 1986
PRAKTISKE ERFARINGER MED CRAY VEKTORPROCESSORER Forfatteren peger også på mulige danske løsninger
Dette indlæg fra lie.scient. Ole Holm Nielsen, Nordisk /nstitut for Teoretisk Atomfysik (NORD/TA), indgår i rækken af artikler om vektorprocessorer
Som et indlæg i overvejelserne om dansk anskaffelse af vektor-beregnings faciliteter berettes her om konkrete erfaringer med anvendelse af CRA Y vektorprocessorer. Det er håbet at mine problemer og erfaringer kan bidrage til en detaljeret vurdering af hvorledes vektorprocessorer bør implementeres som en generei facilitet i Danmark. Ligeledes håber jeg at potentielIe og nuværende CRAYbrugere i Danmark kan hente nyttige oplysninger herfra.
l ca. halvandet år har jeg benyttet vektorprocessorer i mit arbejde, som består i teoretisk beskrivelse af faste stoffers fysik ved hjælp af numerisk løsning af den såkaldte Schrødingerligning. Dette arbejdsfelt har i de sidste 10 år udviklet væsentligt mere avancerede teoretiske såvel som numeriske metoder, som muliggør beskrivelse af nye aspekter ved. faste stoffer. Kravene til EDB-kapacitet er vokset i takt hermed, således at man har bevæget sig fra at benytte de traditionelIe regnecentre over maskiner af typen V AX-1l1780, og nu står i den situation at tidens hurtigste maskiner, vektorprocessorerne, ofte er
KONTAKT nr. 2 - april 1986
nødvendige for at kunne frembringe nye forskningsresultater. Dette manifesterer sig ved at mange skaffer sig adgang til sådanne faciliteter. Jeg vil således anslå at omkring 750/0 af mine kolleger i Europa og USA benytter sig af CRAY vektorprocessorer, mens nogle få har »attached processors« forbundet med en V AX, eller har adgang til en Control Data Cyber 205.
Mine erfaringer stammer dels fra en CRAY -1 installer et hos SAABSCANIA i Linkoping, dels fra en CRAY -1 Sved Bcole Polytechnique nær Paris. I begge tilfælde opnåedes adgangen ved samarbejdsprojekter med kolleger i de respektive lande. Jeg skal opdele erfaringerne i den fysiske adgangsmulighed og i de indhøstede erfaringer ved at benytte en CRA Y vektorprocessor. .
Fysisk adgangsmulighed
Den svenske CRAY -1 er tilgængelig via det svenske naturvidenskabelige forskningsråds (NFR) aftale med SAAB-SCANIA, hvor maskinen i perioder kan benyttes til civil forskning, mens hovedparten af tiden anvendes til klassificerede formål.
13
CRAY'en har som frontends et antal VAX-111780, hvoraf en benyttes til NFR-projekter. Kombinationen af VAX'ens brugervenlighed, CRAY'ens regnekraft og den fornuftige grænseflade mellem de to maskiner gør dette system til det mest slagkraftige som jeg til dato har benyttet til udførelse af store videnskabelige beregninger. Terminaler til NFR's VAX findes i særlige rum ved de svenske universiteter, hvortil sikkerhedsprocedurer mod misbrug er udtænkt. Således er adgang til CRAY fra Danmark ikke tilladt. Adgang til CRAY fra VAX'en er kun mulig i 15 + 30+ 15 minutter (!) hver dag, samt fra 23-07 på hverdagsnætter og ca. 15-07 i weekender. Desværre er adskillige af de opstillede terminaler af forældet type, og kommunikation med 1200175 baud modemer hæmmer yderligere brugeren. Udskrifter kan tilsendes med post, og modtages 2-4 dage efter kørslen.
Det lykkedes mig kun i begrænset omfang at udføre beregninger på denne maskine, grundet de omtalte sikkerhedsmæssige restriktioner . For det første er det umuligt at udføre produktionskørsler fordelt over mange måneder, når arbejdet kræver kendskab til forudgående resultater førend nye kørsler kan påbegyndes, og når fx en times adgang til V AX nødvendiggør at det meste af en arbejdsdag tilbringes med at rejse til/fra Sverige. For det andet er det overordentlig vanskeligt at foretage programændringer, fx for bedre at udnytte vek-
14
tor-faciliteter eller for at rette fejl, når CRAY reelt kun er tilgængelig om natten og i weekends.
Den franske CRAY-IS har vist sig langt mere fordelagtig at anvende i praksis, idet ingen restriktioner pålægges de godkendte brugere. Som frontend benytter jeg et regnecenter med IBM-MVS styresystem, hvortil adgang sker ved telefonopkald til de offentlige datanetværk (en X.25 forbindelse mellem P&T's DATAPAK og det franske TRANSPAC) direkte fra en mikrocomputer ved mit kontor. Driftssikkerheden har vist sig særdeles god, og transmissionshastigheden 1200 baud er tilstrækkelig til produktionskørsler og begrænset programudvikling.
CRAY er tilgængelig døgnet rundt, bortset fra et par timer hvor de franske vejrprognoser udarbejdes. Batch-kørsler på 10-60 CPU sekunder afvikles normalt omgående, mens kørsler på 5-10 minutter og derover afvikles aften og nat. Udskrifter kan vises interaktivt, og kan sendes med post i løbet af 4-5 dage. Idecember 1985 blev det iøvrigt muligt at udveksle filer mellem den franske frontend-maskine og danske regnecentre (fx UNI -C) via EARN-nettet, omend tilslutningen i Paris endnu ikke fungerer pålideligt. EARN vil givet forbedre muligheden for at hjemtage udskrifter og udsende opdaterede programmer betydeligt. Jeg mener dog at man ikke kan undvære muligheden for interaktiv forbindelse med CRAY'ens frontend, idet fejlretning
KO' <T - nr. 2 - april 1986
\1
og programændringer fordrer en høj grad af interaktion. Desuden har frontend-maskinen endnu ikke nogen mulighed for »remote job entry« til/ fra CRAY.
På denne CRAY -1 S har jeg udført omfattende beregninger. Produktionskørsler kan analyseres hver morgen, og nye kan stilles i kø i dagens løb, ligesom evt. problemer omgående kan løses ved korte prøvekørsler. Denne arbejdsmåde er ret effektiv set som mængden af produktionskørsler pr. investeret mandtime. Naturligvis er det betydeligt mere effektivt at arbejde i fysisk nærhed af CRAY, hvor høj datatransmissions-hastighed og omgående adgang til større udskrifter er mulig. Derfor må jeg med mellemrum foretage rejser til Frankrig, når større ændringer og tilføjelser til programmerne skal installeres. Denne rejseaktivitet mener jeg er et uundværligt led i langdistance-anvendelse af EDB-faciliteter, sålænge man ikke råder over forbindelser med høj hastighed.
Praktiske erfaringer med CRAY
Jeg skal nu vende mig til at beskrive erfaringer med at afvikle store videnskabelige kørsler på en CRAY maskine. CRAY'en er kendetegnet ved en særdeles høj regnehastighed. Antallet af flydende-tals regninger (med 64 bit, eller ca. 14 eifre) pr. sekund kaldes FLOPS, og er typisk 1-4 millioner ved sædvanlig skalar-regning, 4-50 millioner ved vektor-regning, og 50-160 millioner i såkaldt super-vek-
KONTAKT - nr. 2 ril 1.986
tor regning (reference 1). Den nye CRAY-2 med fire CPU-enheder har til sammenligning en øvre teoretisk hastighed på 1.2 milliarder FLOPS (reference 2). Således er der store gevinster at hente for programmer som hovedsagelig regner på vektorer, eller som kan bringes til det. Forøgelser i hastighed på 5-10 over skalar-regning er mulig ved omhyggelig strukturering af løkker, og i nogle tilfælde kan yderligere en faktor 1.5-3 nås ved super-vektorisering (»unrolling 00-loops«, reference l). Denne hastigheds-forøgelse sker vel at mærke uden at man er nødt til at programmere i assembler eller kalde særlige vektor-rutiner, omend dette er muligt, men i standard FORTRAN-77 eller PASCAL. Særlige kommentarer i program-kildeteksten (»compiler directives«) fortæller oversætteren om mulige vektor-løkker udover de som automatisk vektoriseres.
Internt arbejder CRAY med et antal vektor-registre indeholdende 64 ord a 64 bit, og selv korte løkker med mindre end 64 gennemløb giver en gevinst, idet 500/0 af maximal hastighed opnås ved løkker af længden 10 (reference 3). Til sammenligning er det tilsvarende tal for en Cyber 205 omkring 100, hvorfor kun algoritmer med meget lange løkker vil være i stand til at udnytte denne mas kine optimalt. Mine egne algoritmer gav på CRAY en faktor 3 i hastighedsforøgelse uden nævneværdig indsats, og ialt en faktor 5 efter indførelse af yderligere vektor-løkker. Derimod
15
kunne mine algoritmer ikke udnytte muligheden for super-vektorisering.
CRAY maskiner har, for at sikre størst mulig hastighed, intet virtuelt lager, og har ofte et fysisk lager på 1 million 64-bit ord. Til nogle anvendelser bliver lagerets størrelse en flaskehals eller direkte en begrænsning, hvorfor mange nye CRAY-installationer ofte har anskaffet 2, 4 eller flere millioner ord. Den ultimative løsning er indført med CRAY-2 som har et lager på 256 millioner ord, omend i en langsommere teknologi end ved CRAY -1, hvorved virtuelt lager må formodes at være overflødiggjort.
En vigtig faktor i anvendelse af vektorprocessorer er styresystemets funktionalitet, og (måske lidt overraskende) i hvilken grad oversætterne fungerer korrekt. CRAY's styresystem COS ligner til forveksling en delmængde af Control Data's NOS, og har ganske få faciliteter så som filhåndtering, biblioteker og oversættere. Systemet er ganske velegnet til batch-kørsler og er let at lære. Interaktiv kørsel er kun del vist muligt (og kun med V AX som frontend) under COS systemet, som ikke er særligt velegnet hertil. Her kan indskydes at Livermore laboratorierne i USA benytter deres eget Cray Time Sharing System interaktivt, og at CRAY-2 leveres med det. velkendte interaktive UNIX styresystem.
CRA Y's FORTRAN-77 oversætter overholder den fulde ANSI-standard. Den har relativt få fejl i forhold til andre FORTRAN-oversættere, og
16
generer derfor normalt ikke brugeren med unødvendig fejlfinding og »Iappeløsninger«. De kolleger som benytter Cyber 205 og visse attached processors (FPS-I64, MAP-6420) fortæller om en væsentligt værre situation mht. ANSI-standarden og fejlfriheden. For mit eget vedkommende var det smertefrit at overflytte programmer fra en V AX til CRAY, idet de eneste ændringer i FORTRAN-koden knyttede sig til fil-navne og deslige.
Konklusion
Jeg mener at CRAY vektorprocessorer er særdeles velegnede til beregninger hvis mest tidsforbrugende dele kan formuleres i vektor-løkker af længde større end ca. 10. I praksis vil de fleste programmer være skrevet i sproget FORTRAN-77. Det er p.t. nødvendigt at afvikle kørsler i batch, hvorfor fx grafisk fremvisning af resultater kun kan ske ved efterbehandling. Denne begrænsning er forsvundet med indførelsen af CRAY-2 under UNIX styresystemet.
Til slut nogle kommentarer om den danske situation: Jeg mener at vektorprocessorer er nødvendige værktøjer for en ikke uvæsentlig del af dansk forskning og erhvervsliv, og konstaterer at de fleste europæiske lande samt USA stiller sådanne faciliteter til rådighed. I øjeblikket er det relativt omstændeligt at anvende vektorprocessorer i Danmark, og det ville være ønskeligt om man anskaffede en CRAY vektorprocessor. Som en overgangsløsning kunne man forestil-
Kr '.I.KT - nr. 2 - april 1986
le sig en aftale med en udenlandsk CRAY-facilitet om adgang og en hurtig kommunikations-forbindelse, fx med en V AX frontend-maskine placeret i Danmark.
H vad angår »attached processors« koblet til fx en V AX mener jeg at disse endnu ikke er tilstrækkeligt fejlfrie og fleksible til at være et alternativ til en CRAY, bortset fra situationer hvor en fastlagt algoritme sjældent ændres, og aldrig skal flyttes til en anden maskine. Dette er imidlertid en atypisk situation i et forskningsmiljø. Ligeledes mener jeg at en CRAY bør foretrækkes fremfor en Cyber 205.
Sammenfattende vil jeg lægge vægt på en høj grad af fejlfrihed ved CRAY-maskiner, at det ikke er nødvendigt at skræddersy sine programmer specielt til CRAY (der kan benyttes standard FORTRAN-77 med »compiler directives«), og fordi høj effektivitet opnås selv med ganske korte vektorer.
Refereneer: J. J. Dongarra og S. C. Eisenstat, ACM transactions on Mathematical Software, Vol. 10, pp. 219-230 (1984). Brochurer »The CRAY 2 Computer System« og »The CRAY X-MP« fra CRAY Research Inc., 1333 Northland Drive, Mendota Heights; MN 55120, USA. R. W. Hockney og C. R. Jesshope, »Parallel Computers«, Adam Hilger Ltd, Bristol, (1981).
Ole Holm Nielsen NORD/TA
KONTAKT - nr. 2 -. il 1986
Danmarks Statistiks tidsseriedatabank
Danmarks Statistiks tidsseriedatabank (DSTB) bliver omlagt i slutningen af april måned.
Denne længe ventede revision medfører bla., at alle tidsserierne skifter navne. Den nye måde at opbygge serienavnene på medfører at centret kan forbedre on-line faciliteterne. ligesom der bliver flere karakteristika for de enkelte serier.
Omlægningen er planlagt til at ske ca. 15. april. I en periode vil både den nye og den gamle databank blive opdateret, således at brugerne får tid til at omlægge deres kørselssetup og programmer.
Alle DSTB abonnenter får skriftlig besked med en endelig plan for omlægningen.
Karsten Vest Nielsen
SPSS/PC+ Det mest udbyggede sratistiksystem til statistisk analyse og rapporrskrivning ril IBM PC/XT/A T og
kompatible mikrodatamlIter
TABLES
SPSS/PC+ ADVANCED STA TISTICS
PRISOPlYSNINGER lexel. momsl: SPSStPC+ hovedmodul: kr. 9.000.-
Tabeller: kr. 3.000.-
Avanceret statistik: kr. 3.000.-
DANMARKS EDØ-CENTER FOR FORSKNING OG UDOAHNElSE
Vermundsgede 5 2100 København ø tlf.: 1011 83 9511
17
,......"
Sign-on forenkles Ny simpel SIGN-ON procedure på de drejede 300- og 1200 baud asynkrone terminallinier
Fra mandag den 9. juni 1986 kl. 9.00, vil centrets drejede asynkrone linier på henholdsvis 300- og 1200 baud blive overflyttet til SPERR Y' s nyeste kommunikationssystem, Communication Delivery 2.
Dette bevirker bl.a. at den tidligere ret så besværlige SIGN-ON procedure ændres, og at en mærkbar hastighedsforbedring på linierne opnås.
SIGN-ON proceduren bliver herefter følgende: l. Efter etablering af modemforbindelsen:
TRYK: CR.
2. Svaret fra SPERR Y-systemet på CR vil være: ENTER USERID/PASSWORD
CLEARANCE LEVEL
Ovenstående gælder for telefonnumrene: 83 83 48 + 83 8055 = 1200 baud 83 9000 + 83 73 33 = 300 baud.
Til sidst skal det blot nævnes, at såfremt man efter den 9. juni 1986 anvender den idag gældende SIGN-ON procedure, kan en af følgende systemmeddelelser fremkomme:
a. TERMINAL SESSION - ALREADY ACTIVE
b. * * NETWORK SIGN-ON FAllED:
12
VERIFY TERMINAL-ID AND REENTER * *
c. * *NETWORK + SIGN-ON FAllED: SIGN-ON COMMAND EXPEC-TED* *
Til disse meddelelser svares med: CRog ENTER USERID/PASSWORD CLEARANCE LEVEL vil fremkomme på terminalen.
Ole Schack
SPSSX lokal dokumentation opdateret
Der er lavet en opdateret og udvidet udgave af hæftet SPSSX Local and Update Documentation. Hæftet indeholder dokumentation for de Sperry-afhængige dele af SPSSx, dvs kald af programmet, filbehandling og ændringer i diverse SPSSx faciliteter, herunder en beskrivelse af hvorledes et SPSS" Crosstabs job kan sættes op til laserprinteren, så »gitteret« i tabellen får fuldt optrukne linier, en detalje, der giver væsentligt pænere tabeller.
Endvidere er hæftet udvidet med en beskrivelse af de fejl, der indtil videre er fundet i SPSS" version 1.0 . Specielt er der omtalt en alvorlig fejl, der får SPPS" til at læse systemfiler generet af SPSS (release 9) forkert. Komandoerne Match files og Add files er ligeledes fejlbehæftede, og der gives løsninger til at undgå fejlene.
Dokumentationen kan rekvireres ved henvendelse til ekspeditonen.
Jesper Lund
KONTAKT· nr. 3 . maj 1986
T DANSK VEKTORPROCESSOR BØR FØLGES OP AF EKSPERTISE I NUMERISK ANALYSE Forsker i astrofysik peger på fordele ved ))mini-supercomputere«
Dette indlæg fra fil.dr. Åke Nordlund, Astronomisk Observatorium, indgår i rækken of artikler om vektorprossorer
Dette indlæg er en forkortet version af undertegnedes svar på en enquete fra Statens Naturvidenskabelige Forskningsråd, vedrørende »DANSKE FORSKERGRUPPERS BEHOV FOR REGNEKRAFTIGT UDSTYR«. Det er mit håb, at de erfaringer fra og synspunkter på forskellige typer af »supercomputers« som jeg her gør rede for, kan bidrage til et fornuftigt valg af anlægstype ved en kommende dansk satsning på sådant »regnekraftigt udstyr«.
Mit forskningsfelt (astronomi og astrofysik) har traditionelt været præget af intensiv brug af datamaskiner (den første datamaskine ved Københavns Universitet var vist nok en Gier-maskine på Astronomisk Observatorium), og min egen forskningsspecialitet (numerisk simulering af hydro- og magnetohydrodynamiske fænomener i solens og andre stjerners atmosfærer) fører til konstruktion af modeller af tidsforløb i tre dimensioner . Numerisk behandling af sådanne modeller er uundgåe-
KONTAKT· nr. 3 . maj 1986
Iigt meget tidskrævende, da selv en marginal opløsning i hver af de tre dimensioner fører til et meget stort antal frihedsgrader, og da en simulering også omfatter mange tidstrin, svarer et enkelt »eksperiment« (simulering) til adskillige timers CRA Y-I CPU tid. Igennem de sidste 6 - 7 år har jeg derfor i perioder været en flittig bruger af forskellige CRAY -l anlæg (Daresbury, MUnchen, Boulder, Linkoping). Jeg har haft stort videnskabeligt udbytte af disse anlæg, men har også høstet en del frustrerende erfaringer, af årsager som nok er af principiel interesse for det valg af anlægstype man nu er ved at træffe her i Danmark.
Dette valg står mellem tre hovedtyper af anlæg: l. Anlæg af typen »array-« eller
»attached-« processor, fx FPS, SPERRY EAGLE, IBM Vector Facility.
2. Traditionelle »supercompu-ters«, fx CRAY, CDC, Fujitsu
13
3. . En ny type »mml-supercompu-ter«, fx Alliant, Convex, ...
Erfaringer fra traditionelle supercomputere
De to første typer af anlæg kan være vidt forskellige med hensyn til egenskaber hos den centraie komponent i systemet (»vektor-processoren«), og der kan være forskelIe set fra brugerens synspunkt; fx speeielle subrutine kald (FPS), forældede styresystemer (CRAY JCL), etc. Disse to (konventionelle) typer af anlæg fører dog til en, fra brugerens synspunkt, næsten identisk organisering aj arbejdet, og her ligger de store ulemper, som jeg gerne vil pege på.
Et anlæg af type 1. eller 2. består af en eller flere »vektor-processorer«, evt. med eget pladelager, en eller flere »frontend-maskiner« med pladelager, et baggrunds- (masse-) lager, og et antal (fjerne) bruger-maskiner, koblede til supercomputeranlægget med et netværk. Brugeren »ser« et lokalt operativsystem (V AX/SPERRY /IBM/UNIX), hvorfra man kan sende batch-jobs til afvikling (netsend). Jobkommandoer i batch-jobbet (CRAY JCL) sendes via netværk til frontend og herfra til CRAY. Jobbet går ind i en af flere køer Gobklasser). Når jobbet starter, hentes dataset fra baggrundslager til pladelager (kort levetid på pladelager), mindre dataset hentes via netværk fra lokal maskine, jobbet eksekveres, print dataset sendes til frontend til videre
14
foranstaltning (papir, mikrofilm, 35mm film, retur til brugermaskine, ... ), plot dataset sendes til plotter, eller gemmes som metakode, log dataset sendes til brugermaskine. Disse dataset har forskellige navnekonventioner på forskellige dele af systemet, og der skal skrives skrives skrives JCL og huskes huskes huskes forskellige filnavne.
Selv det mindste job (JCL ERROR) tager adskillige sekunder (op til minutter) tur/retur ved minimal belastning (overhead i køer, frontend, ... ). Mere typisk er der fyldt op i køer (tit på grund af flaskehals i periferudstyr, fx baggrundslagertrafik). Dvs at den normale programmerings-cyklus (tænke - skrive - tænke - syntaks fejl - tænke - linkfejl -tænke - eksekveringsfejl - tænke -usynlige fejl - tænke .. ) tager alt for lang tid, betydeligt længere tid end på en interaktiv maskine. Der er også en kæde af ting, der skal virke (lokal maskine, netværk, frontend, supercomputer, baggrundslager), dette betyder at sandsynligheder for at systemet som helhed virker i en hel dag kun er måske 50070, selv om den er 90% for hver af de indgående dele.
Interaktiv vektorgrafik og rastergrafik, der er overordentlig vigtig ved test og udvikling af nye metoder, er ikke mulig, og for brugere på afstand er også almidelig (pen-plot) grafik besværlig.
Et stort apparat (biblioteker, joborganisation, data-håndtering, grafik, ... ) hører til et normalt forsk-
KONTAKT nr. 3 maj 1986
ningsprojekt. System-eksperter og »management« har ofte ikke forståelse for, hvor maskine- og system-afhængig dette apparat er (selv om indgående FORTRAN-77 software er helt transportabel), og hvor stor en produktivitets gevinst der kan opnås ved homogene omgivelser og en høj grad af interaktivitet.
Systemet er også (som per naturlov) altid overbelastet, og først når det gør rigtigt ondt bliver presset stort nok til at indkøbe en ny maskine. I løbet af kort tid er så denne også overbelastet (på NCAR var CRAY nr. to overbelastet fra starten!).
En ny type supercomputer
Der er i lø bet af de sid ste par år kommet en række maskiner aI' en ny type på markedet; eksempelvis Alliant, Con v ex, American Supercomputers, Gould, Scientific Computing Systems ... Denne type (»mini-«) supereomputer er typisk opbygget efter samme grundprincipper som en konventionel supercomputer (speciel hardware for vektorregninger, »pipelining«, etc.), men baseres på »off-the-shelf« komponenter. Dette medfører et drastisk reduceret kølebehov (luftkøling, få kW) og en drastisk reduceret pris, men alligevel vektorregningskapacitet af størrelsesorden en halv CRAY -1 S.
Disse maskiner har mange fælles træk: UNIX operativ system, VAX kompatibel FORTRAN oversætter, (de sigter på samme markeds-niche), men som et konkret eksempel skal her nævnes Alliant FX/8, der måske også er den aller mest interessante af disse
KONTAKT nr. 3 maj 1986
maskiner. Interessen for disse maskiner er meget stor på USA markedet.
Alliant FX/8 er en multi CPU maskine, der bruger en avanceret parallei arkitektur. Maskinen kan på et vilkårligt tidspunkt software-konfigureres til at køre de otte proeessorer uafhængigt, parallelt, eller i en passende blanding med fx 4 uafhængige, 4 i paralleI. Typisk vil der være tale om at køre alle proeessorer uafhængige ved høj belastning (mange brugere), da man så enkelt kan opnå fuld belastning af alle otte CPUer. Ved lav belastning (få brugere) køres flere proeessorer parallelt, hvilket giver mulighed for at sprede en opgave over flere proeessorer , og herved igen opnå fuld belastning. Dette er muligt (og sker uden indgreb fra brugerens side) takket være en FORTRAN kompiler der kan ud nytte flere proeessorer , fx til multidimensional matrixregning, og til rekursive beregninger af typen
F(l,l) == F(l,I)/F(l-l,2) F(l,2) = F(I,2)-F(l,l)*F(I-l,3)
(løsning af tri-diagonalt ligningssystem). Denne type af problem er meget almindelig, men kan ikke vektoriseres på en konventionel vektormaskine.
De fleste andre maskiner af denne type, bruger UNIX operativsystem og er dedikeret interaktive maskiner. Den interaktive kommunikation med brugeren håndteres af speeielle processorer , og belaster ikke de aritmetiske enheder.
15
. t
I
Sammenligning at de tre hovedtyper at maskiner
Egenskab A IBM 3090
Mflop/M$ll 12/5
= 2.4
Industristandard NE]
operativ system 51
VAX FORTRAN NEJ kompatibel 21
\ lan lid bygges NEJ grad\i~ ~)
Kan op:,tilles NEJ ho.'> brugeren ~)
Dri fhi k kerhed ' ) afhængig ar vært,datamat
Lokalitets- kræver
beho\ værtsdatamat
Kommentarer til tabel:
I) Mjlop/M$. Disse tal cr baserede pa Peljormance of Various Computers Using Standard Linear Equation Sojiware in a Fortran Environment, Jack 1. Dongarra, Argonne, Tech. Mem. No. 23, og approksimative listepri.ser i $.
16
Det skal bemærkes, at koncentration al' denne produktivitet til cen maskine (fx CRAY /XMP) ikke er en fordel, da den enkelte
TYPE
B C valg CRA Y-XMP-12 Alliant FX/8
24/8 6.2/0.62 C
= 3 =10
NEJ JA C
NEJ JA C
NEI JA C
NEJ JA C
højteknologi,k, redundans, C dyrt underhold modulær,
off-,hel f
omfattende ringe C lok. in vest. lok. imest.
bruger sa istedet skal konkurrere mcd flere brugere, p[, en mask ine der er mindre lettilgængelig og mindre interaktiv. Det skal også bemærkes, at selv i test med »alle midler tilladte« (maskinkode programmering) opnår en Alliant FX/8 større produktivitet end en CRAY /XMP; CRA Y /XMP-4 (med 4 processorer) 715124 = 29 Mflopl M$, Allianl FX/8 (med 8 proeessorer) 22/0.62 = 35 Mflop/ M$.
2) VAX FORTRAN. Da dissc ma-
KONTAKT nr. 3 mal 1986
med flere brugere, på en maskine der er mindre lettilgængelig og mindre interaktiv. Det skal også bemærkes, at selv i test med »alle midler tilladte« (maskinkode programmering) opnår en Alliant FX/8 større produktivitet end en CRA y IXMP; CRAY IXMP-4 (med 4 proeessorer) 715124 = 29 Mflopl M$, Alliant FX/8 (med 8 proeessorer) 22/0.62 = 35 Mflopl M$.
2) V AX FOR TRAN. Da disse maskiner sig ter på at erstatte mange af de V AX 7XX systemer, der nu er håbløst overbelastede, er V AX FORTRAN (do while etc.) standard. Dette bet yder at en stor mængde danske programmer udviklede på V AX installationer , der ellers skulle omskrives (til mindre læselig FORTRAN) for at udnytte det regne-kraftige anlæg (fx CRAY IXMP), umiddelbart kan bruges.
3) Drijtsikkerhed. Mange af delsystemerne i en Alliant er (mange-)doblede, og ved driftforstyrrelser kan fejlende komponenter forbi-kobles med software. Systemet er opbygget med få og selvdiagnosticerende delkomponenter. Hvis, i sjældne tilfælde, en node i netværket fejler totalt, kan andre noder overtage arbejdet.
4) Udbygning, ud flytning. En AIliant FX/8 med een CPU koster
KONTAKT nr. 3 maj 1986
270.000$, inkl. disk og tapes tation. Hver yderligere CPU koster ca. 40.000$. Med disse priser kan man foretage en systematisk forøgelse af CPU kapaeiteten i takt med voksende behov.
5) Operativsystem. I denne forbindelse har operativsystemet UNIX en række distinkte fordele:
UNIX er industristandard, og findes på alt fra IBM PCI AT til CRAY -2. Herved møder brugeren det samme system på alle niveauer.
UNIX har et hierarkisk filsystem, der gør det nemt og naturligt for brugeren at organisere filer efter projekt, delprojekt, programpakke, bibliotek, korrespondance, artikler, rapporter, etc. Dette er ikke muligt med et »fladt« filsystem aftype SPERRYelIer IBM.
UNIX er et meget kraftfuldt interaktivt operativsystem, med en mængde værktøjer til programudviklingl vedligeholdelse, der forhøjer den enkelte forskers produktivitet.
Kommando »pipelines« og input/ output redirect gør det nemt og naturligt at opbygge programsystemer modulært.
Fuldskærmseditorer (vi, emacs, ... ) der er klart overleg-
17
,
I
ne andre systemer (IBM XEDIT, SPERRY CTS).
Der findes et stort antal kraftfulde arbejdsstationer, der bruger UNIX eller UNIX lignende operativsystemer (SUN, Apollo, Hewlett Packard, Zilog, Cromemco, .. ). Mange institutter og industrier bruger allerede sådanne systemer til CAD/CAM og lignende opgaver. Sådanne arbejdsstationer vil umiddelbart kunne tilsluttes netværket.
Ved valget af nye maskiner til netværket af regne-kraftige anlæg er man meget frit stillet. Som nævnt ovenfor bruger de fleste af de nye »mini-supercomputere« UNIX, ligesom CRAY-2 (og CRAY-3). Også eksisterende »mainframes« (SPERRY, IBM) kan køre UNIX (samtidigt med det normale operativsystem), og kan herved tilbyde et homogen brugermiljø.
Konkluderende bemærkninger
Der er ingen tvivl om, at Danmark behøver en kraftig satsning på »regnekraftigt udstyr«, og at den relativt sene udvikling på dette område indebærer et handicap i forhold til andre industrilande. Der bør foretages en koordineret investering i et netværk af regnekraftigt udstyr .
Det er meget vigtigt at en sådan investering i »hardware« følges op af en
18
ordentlig investering i »ekspertise«. Her hentyder jeg ikke alene til ekspertise i brugen af de specifike egenskaber hos vektorprocessorer (en typisk FORTRAN kyndig forsker vil i løbet af få dage have lært hvilke principper der er afgørende for en effektiv vektorisering af et givet stykke programmeI). Langt vigtigere er at få udbygget en ekspertise i generei og problemorienteret numerisk analyse (et fag der må siges at have været sørgeligt forsømt fx ved Københavns Universitet).
Ironisk nok giver den forsinkede danske satsning os nu en unik chanee til at springe et trin i udviklingen over; den ny generation af »mini-supercomputere« har afgørende fordele overfor den traditionelle type af supercomputere og er desuden kompatibel med næste generation af »front-linie« supercomputere (CRAY-2, CRAY-3).
Det er af største vægt, at man undgår, at brugeren konfronteres med flere lag af forskellige st yre- og filsystemer, men at man i stedet møder et homogent og kraftfuldt styresystem med høj grad af interaktivitet og med fornøden støtte af interaktivt grafisk udstyr. Et netværk af den nye type af »mini-supercomputere«, med UNIX operativsystem som fælles brugerflade, er her det naturlige valg.
I forhold til det der ellers sker på computer markedet idag (»mus« styrede PC'er og arbejdsstationer med avanceret CAD/CAM grafik udstyr), er den centraie batch-orien-
KONT AKT nr. 3 - maj 1986
terede supercomputer en anakronisme.
Åke Nordlund Astronomisk Observatorium
Ny version af PHOTODOC PHO * TO. DOC erstattes at version 7R4 den 3. juni
Versionen har indtil nu kørt som PHO * TO.DOC/7R4 og indeholder de faciliteter, der er beskrevet i Photodoc manualens udg. 6. Herudover er der kommet et græsk tegnsæt i Times ordinær, gruppe kode »0«. Interesserede kan få en tabelover tegnsættet ved henvendelse til centrets ekspedition.
ADVARSEL!
Den ny version giver en anden ombrydning end den gamle, og man kan derfor ikke med held udføre en del af en sætteopgave med den gamle version, og en anden del med den nye. ForskelIene kan være helt op til 3 linier pr. side. Den gamle version er stadig tilgængelig som PHO * TO.DOC/7Rl.
Henrik Rue
KONTAKT - nr. 3 mai 1986
Kommunikationssystemet CD-2 indkøres Alle med taste linier berøres
Centret annoncerede i sensommeren 1985 i det daværende RECKU NYT nr. 144 den igangværende indkøring og idriftsættelse af SPERRY's nyeste kommunikationssystem, Communication Delivery 2 (CD-2), og siden i samme organ nr. 145 om de vanskeligheder, projektet var løbet ind i. Samtidig lovede vi at vende tilbage til sagen, når problemerne var løst.
Problemerne er i den mellemliggende periode løst, hvilket bet yder, at centret nu for alvor kan gå igang med en over flytning fra de idag kendte kommunikationssystemer til CD-2.
Rent praktisk viloverflytningen foregå ved, at alle brugere, der idag har faste forbindelser til centret, vil blive kontaktet i løbet af de kommende måneder for nærmere orientering.
For MICROMUX-brugere gælder at det Micromux-programmel, der idag er installeret skal udskiftes med en ny version. Selve udskiftningen foretages af UNI-C, ligesom udgifterne i forbindelse hermed bekostes af UNI-C.
Ole Schack
19
Efterårets kurser Nye UN/- C kurser
Et nyt fælles kursusprogram for hele UNI - C er på trapperne. Det forventes udsendt i begyndelsen af juli.
Det er et omfattende program indeholdende kurser på hovedanlæggene CDC, IBM og Sperry samt mikrodatamaterne Partner og IBM PC og gælder for efterårssæsonen 1986.
Nyheder
Af nye kursusemner kan nævnes Pascalog dBaseIII workshops, hvor deltagerne får mulighed for at arbejde med egne opgaver. Bemærk iøvrigt, at både dBase og Dantekst kurserne afholdes med nye forbedrede udgaver af dette program mel i forhold til sidste sæson.
Andre spændende nyheder er kurser i SPSS/PC + og MS/PC-DOS.
Administrative ændringer
Som det vil fremgå af programmet, er der foretaget justeringer omkring tilmelding, afmelding og betaling af kursusgebyr .
Det har endnu ikke været praktisk muligt at oprette fælles indbetaling og administration for centret som helhed. Vi håber, at vi med næste kursusprogram, der udkommer sidst på året, har klaret dette problem.
Det bet yder , at vi må bede brugerne være opmærksomme på, at kursusgebyret sendes til den region, hvis
6
kursus brugeren ønsker at deltage i. Vi glæder os til at byde nye og gam
le kursister velkommen til en ny kursussæson. Den starter den 1. september.
~ 7\6)'/)) y{fl
-m --=~ ~c:;'"
A1ariann Slot
EARN brochure
Der er udgivet en brochure om EARN som introduktion til det EDB-net Danmark blev tilsluttet for godt et år siden.
EARN giver· indtil videre uden beta· ling . mulighed for at sende filer mel· lem over tusind universiteter og forsk· ningscentre i Europa, USA og Canada, foruden formentlig endnu flere insti· tutioner tilsluttet andre net.
Der er i øjeblikket tilsluttet 9 knu· depunkter i Danmark, og de udveksler for tiden omkring 10.000 filer per måned med udlandet.
Brochuren kan fås ved henvendelse til UNI-C, ekspeditionen.
KONTAKT . nr. 4 . juni 1986
-'
i>
ERFARINGER MED BRUG AF SUPERDAT AMATER Krav til vektorprocessorer
Dette indlæg fra lektor, cand. scient. Axel Hunding, Medicinsk-kemisk Institut, Panum Instituttet, indgår i rækken af artikler om vektorpro~ess~rer
. 75070 af koden, vII glve beskedne Interessen for den faktisk udnytt.ehge hastighedsgevinster. Udføres 50070 af ydeevne af superdatamater er stlgen- koden skalært og resten (meget hur-de. Mange brugere af EDB har hørt tigt) paralleltlvektorielt, opnås højst om sådanne maskiners topydelse, der en faktor 2 i gevinst over ren skalær oftest ligger i område: 100-5.00 afvikling. MFLOPS (million fl?atmg po~nt Adskillige superdatamater har en operations per sec.). Til sammenhg- skalær hastighed i området 8-15 ning yder den populære V AX 11/700 MFLOPS. I praksis er det derfor af-FPA ca. 0.5 MFLOPS, Sperry gørende, at store dele af den valgte al-1100/90 ca. 4 MFLOPS OG IBM goritme kan køres paralleltlvektori-3081 Dca. 3 MFLOPS. elt.
Det er imidlertid vigtigt at under- Eksempler på problemer, der ikke strege, at den hastighedsforøgelse de egner sig til de nuværende superda-fleste brugere vil få på en superda- tamater, er ikke-lineær optimering tamat bestemt ikke står i noget e~kelt (datafitning), numerisk integration, forhold til de respektive ma~kmers løsning af (små systemer af) alminde-formelle topydelse. I dette l?dlæg lige differentialligninger med mange skal nogle almindelige internatIOnaie tidsskridt, programmer med relativ erfaringer omtales ve~~ørende. brug meget ind- og udlæsning af data (ad-af superdatamater. TIlhge er mklu- ministrativ EDB) m.m. Hastigheds-deret nogle af mine egne erfaringer forøgelsen ud over skalær-hastighe-med brug af CRAY X-MP /22 ved den er omtalt for en rækkeanvendel-Jiilich via EARN. ses områder i en artikel af l.S. Duff i
Internationale erfaringer med su- ovennævnte reference. Den er typisk perdatamater kan findes i litte~a- 2-5 for områder som vejrforudsigel-turen, fx fg.!!l.J?.!1tational __ rl.!~ICS ser, aerodynamik, atomenergi, og COlllI!!.!!nL~_~12~: Som ho- teoretisk fysik, omend enkelte pro--vechegel gælder, at problemer, der blemer kan opnå væsentligt større kun kan programmeres. til. parallell gevinster. Det svarer til opnåede vektoriserbar udførelse l mmdre end hastigheder på ca. 20-50 MFLOPS.
KONTAKT nr. 4 . juni 1986 7
Ofte benyttede matrix programmer (fra fx NAG-biblioteket) kan specialkodes til at give 20-65 MFLOPS (CRAY-IS), 65-125 (CRAY X-MP) og 25-85 (Cyber 205) for matricer af dimension 200.
Ud fra disse tal er det ikke rimeligt at forvente en gevinst på meget mere end højst en faktor 2-3 over skalærafvikling, hvis en bruger forsøger at køre et tidligere ud viklet program på en superdatamat. Internationalt har det imidlertid vist sig, at betydeligt højere gevinster kan opnås, hvis brugeren har et godt kendskab til alternative algoritmer (hvoraf nogle måske i langt højere grad vektoriserer), samt kender de fleste af de faldgruber , uhensigtsmæssig programmering kan opvise. Det første kræver fortrolighed med numerisk matematiske metoder og der er betydelig aktivitet internationalt omkring emnet. Det sidste kan relativt hurtigt læres ud fra optimeringsvejledninger, tilpasset de enkelte maskiners arkitektur.
Program Nr.
MFLOPS
2 3 456
(CRAY IX-MP): 153 77 96 41 9 8
Som det ses er der stor variation af den udnyttelse af maskinens ydeevne, der kan opnås. Flere internationalt foretagne sammenligninger mellem forskellige maskiners ydeevne er gennemført med programmer, der ligger i den langsomme del af skalaen. Det er
8
Af simple regler kan nævnes, at man om muligt bør tilsigte, at både additions- og multiplikations-piperne er i arbejde samtidig (ehaining), hvilket lettes, hvis der refereres mindst muligt til data i memory, samtidig med at sløjferne (DO-l 00 ps) indeholder mange operationer. Simple sløjfer, hvor loop indeks løber over første array-indeks med en tilvækst på een er at foretrække (for at undgå 'bank-eonfliets'). Betingede sætninger bør undgås i loops, men i en række tilfælde kan de med fordel omskrives, således at vektorisering opnås. Med et rimeligt kendskab til sådanne simple regler kan man godt opnå særdies høje regnehastigheder med rene FORTRANprogrammer (et af vore produktionsprogrammer kører med 194 MFLOPS på CRAY X-MP). Det· afhænger imidlertid også af problemets natur, og af den valgte algoritme, hvilket kan ses af de standard test-kørsler, der ofte refereres til i litteraturen når forskellige maskiner skal sammenlignes (Livermore-programmerne):
7 8 9 10 I1 12 13 14
168 % 163 66 3 77 5 7
således her mere maskinernes relative skalær-hastighed, der sammenlignes, end deres brugbarhed som egentlige superdatamater . Fx angiver mange fabrikanter af prisbillige 'attaehed processors', at deres maskine er næsten lige så hurtig som en Cray-I S på
KONTAKT - nr. 4 - juni 1986
et givet testprogram. Undersøger man imidlertid de faktisk opnåede regnehastigheder , vil man se, at der i begge tilfælde ikke opnået mere end 10-20 MFLOPS. En vigtig grund til, at 'attaehed proeessors' som hovedregel ikke i praksis opnår de helt store ydelser er, at memory ikke er konstrueret til at føde CPU 'en med en hastighed der er væsentligt større end skalær-enhedens. Der er således en 'flaskehals' i systemet (for lille båndbredde for overs førsel af data til/fra CPU'en). Selv i CRAY -I serien er båndbredden relativ snæver i forhold til CPU'ens topydelse, et forhold der er afhjulpet på CRAY X-MP.
Det er tidligere nævnt her i bladet, at Jiilieh-eentrets CRAY X-MP kan anvendes fra UNI-C via EARN. Erfaringerne er, at eentret sjældent er nede, og at kørsler (på 5 min eller mindre, med ca. I M lagerkrav) ligger i kø 1-2 timer med mellemprioritet (ca. 1.10 kr/CPU-sek). Selve EARN kan undertiden være nede (hoved sagelig fordi en af de hjemlige nodes er nede), men ellers kan der transmitteres med net-hastighed tilsyneladende uden væsentlig forsinkelse. I praksis er det således muligt at afvikle 3-4 kørsler på en arbejdsdag, selv om output fra den forrige kørsel skal vurderes før næste afsendes. Til sammenligning vil en enkelt sådan kørsel først være afviklet efter 2-4 døgn på fx en lokal VAX 111750FPA.
På disse betingelser er det klart, at konkurreneen med udenlandske forskere vil blive kraftigt skærpet i takt
KONTAKT - nr. 4 - juni 1986
med, at flere og flere opnår adgang til superdatamater. Hvis danske forskere ikke får let og billig adgang til sådanne anlæg, vil vi ikke kunne deltage i den videre udvikling på et konkurreneedygtigt niveau.
Axel Hunding Medicinsk-kemisk Institut
Før hed det NEUCC-RECKU
Publikation nr 43, der beskriver transmissionssystemet mellem UNI.C's afdelinger i Lyngby og København er nu kommet i en ny udgave med titlen
IBM(MVS) - SPERRY TRANSMISSIONSSYSTE~IET
Jan P. Sørensen
9