9. Import masterthesissen

9.1. Aanlevering

De eindwerkadministratie gebeurt in SISA.

De SISA administratie maakt jaarlijks een xml file. Deze bevat de beschrijvende metadata van de nieuwe thesissen conform de afgesproken specificaties.

Het xml bestand wordt ter beschikking gesteld via sftp. Uitgevoerde procedures en details zijn per academiejaar beschreven in JIRA.

Naast de xml worden de thesissen digitaal aangeleverd in pdf en/of zip formaat. In de xml is een verwijzing opgenomen naar deze bestanden.

De originele bestandsnaam - zoals gesubmit door student - blijft behouden en krijgt een prefix

Voorbeeld:

student laadt op: Pintramagazine_17.pdf => SISA prefixt: 20161315_M0001001_2170_ZIT1_Pintramagazine_17.pdf

op de sftp-server zullen de bestanden in een subdirectory komen per student (en per plan, academiejaar en zittijd)

Voorbeeld

20161315_M0001001_2170_ZIT1_Pintramagazine_17.pdf zal in de directory ‘20161315_M0001001_2170_ZIT1’ terechtkomen.

9.2. Conversie naar catxml

Note

Conversies tot 2017 zijn gedocmenteerd in oude issuetracker

Note

Indien UT8 codering foutief wordt aangeleverd is een noodoplossing voorzien

Het ontvangen bestand wordt omgezet naar catxml via de toolcat applicatie tezo

Caution

zipfiles worden enkel gearchiveerd en worden in het inhoudsveld genoteerd met toegangscode 'noaccess' (GDPR-beperking)

tezo -toxml filename.xml prefix=etdua

Indien nieuwe studiecodes voorkomen wordt dit door de tezo tool gerapporteerd. Voor deze studiecodes moet omschrijving worden opgevraagd bij SISA.

Nieuwe reeks aanmaken indien er nog geen bestaat waaraan deze nieuwe opleiding kan gekoppeld worden. Nieuwe studiecodes en nieuw aangemaakt reeksen toevoegen aan relevante vertaaltabellen

Indien noodoplossing nog van toepassing is en titels en abstracts afzonderlijk worden aangeleverd, volgende routine uitvoeren:

sudo tezoba xml

Note

(uitvoeren in directory waar xml staat, de directories TITELS en ABSTRACTEN moeten subdirectories zijn)

Resultaat: nieuw xml file met titels en abstracten en extensie xml.xml

Deze via tezo opnieuw omzetten naar catxml. Dit is het finaal te importeren bestand.

tezo -toxml filename.xml prefix=etdua

Plaats de op te laden full text bestanden in een (lege) directory

Voer uit, vanuit deze directory: (pas MY aan) (Hiermee worden de full text bestanden gestockeerd in docman, en wordt een referentieglobal aangemaakt):

docino -store */*.pdf */*.zip db=etdua hidden=y mumps=BTEZO/doc/sisa2220 verbose=no
docino -store *.pdf *.zip db=etdua hidden=y mumps=BTEZO/doc/sisa2220 verbose=no

uitlijsten van referentieglobal kan via mutil -gl BTEZO/

Importeer catxml :

catcnv -import filename.cat.xml profile=etdmaster

Pas de full text verwijzingen aan naar de definitieve docman referenties :

vervang de lijst id door een passende lijst van catalografische records)

Dit toont de te verwerken wijzingen.

Indien goed bevonden, voer hetzelfde uit met paremeter "U" i.p.v. "V", voor onherroepelijke update.

9.3. Backup

na volledige operatie worden bestanden verhuisd van library/process naar Backup Server

Gaat om mappen etd en conversion/tezo naar /backup_remote/archive