HEADER COMMENTATA [Estremi identificativi del documento] ----- ansi;unicode [Codifica caratteri: nel caso del Corpus d'Ateneo, la codifica è ansi.] ____ [Si intende di default la lingua italiana in quanto il corpus è composto da testi in lingua italiana.] (nome;?,cognome;?),(nome;?,cognome;?),… [Si inserisce il nome dell'autore. In caso di più autori si inseriscono le informazioni come nel tag soprastante, altrimenti nome,cognome senza parentesi.] nick;0,adress [=From] (nick;0,adress);(nick;0,adress) [=To] [i due tags ono importati da NG e servono o per le lerre ed email o per articoli scritti con nom de plume; cfr l'art. firmato "gatto lupesco" in Newsletter VII (2004) 3]. (nome;?,cognome;?);0,(nome;?,cognome;?),… [Se necessario si inserisce il nome e il cognome del traduttore nello stesso identico modo indicato per l'autore, altrimenti si attribuisce 0 al tag in quanto non pertinente.] (nome,cognome);ente [default: Ufficio Stampa dell'Università degli Studi di Torino] ____;0;? [Si inserisce il titolo del testo. E'possibile abbreviarlo in caso di eccessiva lunghezza. In caso sia assente si pone un titolo redazionale.] (aaaa,mm;0;?,gg;0;?);(0;?) [Data della composizione del testo o di quando il testo è stato pronunciato. Quando un valore non è noto si inserisce ? altrimenti 0 se il valore non è pertinente.] città;?,nazione,? [Luogo in cui il testo è stato composto o pronunciato con l'abbreviazione della nazione. Per Ateneo i testi si intendono di default Torino,IT] scuola Università degli studi di Torino [Estremi identificativi della fonte da cui sono stati tratti i testi.] ____ [Si inserisce Ateneo. Il nome ufficiale Athenaeum sarà sostituito via script per evitare errorri di battitura.] riv;vol;read;NG;altro;0;? [Riv di default] nomefile;0 [Si inserisce il nome del file in cui viene incollato un eventuale testo riportato, altrimenti se il campo non è pertinente si attribuisce valore zero. Nel file contenente il testo riportato si inserisce un link al file originario da cui il testo è stato spostato.] titoloRiv;titoloVol;titoloRead;nomeNG;nomeAltro;0;? [default: l'Ateneo - notiziario dell'Università degli studi di Torino] [default: Dall'Università - Notiziario dell'Università degli studi di Torino] (annata_nnn;0;?,fasc_n;0;?,npf_nnn;0;?,suppl;0,pag_nnnn- nnnn;0;?),0;? [Si inseriscono gli estremi della rivista Ateneo: l'annata in numeri romani, il numero della rivista, il numero progressivo del fascicolo (che appare sulla copertina e che non corrisponde al numero del fascicolo), l'eventuale annotazione del supplemento e il numero delle pagine dalla prima all'ultima in cui il testo è stampato sul numero cartaceo.] volume_nn-nn;?,pag_nnnn-nnnn;?,0;? [si attribuisce sempre 0] nomecollana,0;? [si attribuisce sempre 0] (aaaa,mm;0;?,gg;0;?);(0;?) [Si inserisce la data di uscita della rivista. Nel nostro caso il formato della data è: aaaa,mm-mm,0] ____ [Si intende di default Torino in quanto la rivista viene stampata a Torino.] editore;sitoweb;usenet;0;? [default: Università degli studi di Torino] 1;2;…,g1;nInterv×Convegno ____;0 [Se il numero ha al suo interno delle monografie, cioè degli articoli raggruppati con un titolo, oppure se riporta alcuni interventi relativi a un convegno occorre prestare molta attenzione ai tag gruppo_num e gruppo_nome. Se ci sono ad esempio 10 articoli relativi a un convegno su Massimo Mila (ved. il numero 12 di Ateneo) al primo articolo occorre inserire all'interno di gruppo_num 1,g10 al secondo 2,g10 al terzo 3,g10 e così via e a gruppo_nome inserire il nome che la rivista dà al monografico o il nome del convegno cui appartengono gli atti. In questo caso è "Numero monografico dedicato a Massimo Mila" e quindi in gruppo_nome occorre inserire numero monografico dedicato a Massimo Mila. Attenzione! Per gli articoli singoli occorre sempre inserire 1,g1 all'interno di gruppo_num e 0 all'interno di gruppo_nome. LO stesso vale per le sezioni o rubriche fisse di un giornale (cfr. la newsletter).] m;f;?;ente;gruppo 1-7;8-13;14-18;19-25;26-30;30-40;40-50;oltre;? ___;0;? ___;? 1;2;3;? ____;?,____;0;? ____;0;? [Si inseriscono i dati relativi all'autore: il sesso, l'organizzazione cui appartiene, la mansione ricoperta al suo interno. Normalmente in Ateneo l'età e lo status presentano sempre ?. In lingua1 si inserisce italiano e ? in lingue.] ripeti_autore_o_canc ripeti_autore_o_canc [Questi due tag soprastanti si utilizzano nel caso in cui il testo sia stato scritto da più autori.] m;f;?;ente;gruppo;0 1-7;8-13;14-18;19-25;26-30;30-40;40-50;oltre;?;0 1;2;3;?;0 ____;?,____;0;? ____;0;? [Si inseriscono se necessario le specifiche relative al traduttore (i cui tag presenti sono identici a quelli relativi all'autore per quanto riguarda la loro compilazione) altrimenti si attribuisce valore 0.] ripeti_traduttore_o_canc ripeti_traduttore_o_canc [Questi due tag soprastanti si utilizzano nel caso in cui il testo sia stato tradotto da un gruppo composto da più traduttori.] c-lib;tes;dial;ques;es- trad;dett;rias;email;lett;mgraf;art;rec;rom;nov;poem [Normalmente ai testi del Corpus d'Ateneo si attribuisce art. Nel caso di biografie di coloro che sono stati insigniti della laurea honoris causa si attribuisce bio. (vedere in fondo le combinazioni di tag utilizzate normalmente per i testi del Corpus d'Ateneo). Nel caso (Newsletter) di recensioni librarie e cronache - comptes rendus - di convegni si usa rec. + categorie del corpus IUS già introdotte: reg, docPr [[In generale si tenga presente che: per tstile legisl e tfine regol i ttipo attualmente presenti in IUS e importabili in ateneo sono: l legge ordinaria lr legge regionlae dl decreto legge dlgs decreto legislativo dm decreto ministeriale dpcm decreto del Presidente del Consiglio dei ministri dpvcm decreto del vicePresidente del Consiglio dei ministri dpr decreto del Presidente della Repubblica dim decreto interministeriale ddg decreto dirigenziale ddr decreto direttoriale dcsm decreto Consiglio superiore della magistratura c circolare n nota cm comunicazione dir direttiva dis disposizione det determinazione prp proposta prv provvedimento rel relazione ord ordinanza reg regolamento + docPr documento programmatico (manifesti, carte) ]]] Il docPr è stato introdotto per la carta di Torino su Uni e ricerca in Newsletter, cui è stata daTA LA COMBINAZIONE: docPr amm regol saggL;saggS;giorn;man;amm;legisl;acc [In caso {Ath,New} di un testo riguardante argomenti di carattere umanistico si attribuisce saggL. Al contrario per testi riguardanti argomenti scientifici si attribuisce saggS {Ath,New} . giorn viene utilizzato {Ath} nel caso delle presentazioni dei numeri della rivista scritte dalla redazione o {New} in articoli in cui prevalga l'aspetto di cronaca. acc viene utilizzato per le laudatio {Ath} e document per le biografie di coloro che sono stati insigniti della laurea honoris causa {Ath} o ___ {New} . (vedere in fondo le combinazioni di tag utilizzate normalmente per i testi del Corpus d'Ateneo).] divulg;spec;artist;intratt;inform;regol;celeb [Viene utilizzato divulg se il fine del testo è divulgativo, altrimenti spec se il testo è di carattere specialistico. inform viene utilizzato se il testo è di carattere informativo e celeb se di carattere celebrativo come nel nostro caso per le laudatio {Ath} o biografie commemorative encomiastiche {New}. (vedere in fondo le combinazioni di tag utilizzate normalmente per i testi del Corpus d'Ateneo)] ... [da definire] ____,____,____,____,____ [Devono essere obbligatoriamente inserite 5 parole chiave relative agli argomenti trattati nel testo markuppato.] originale;traduzione;riscrittura [Si utilizza originale se il testo è pubblicato per la prima volta, traduzione se si tratta di una traduzione e riscrittura se si tratta della pubblicazione di un testo scritto in passato e che viene riproposto.] ____;0;? [Si utilizza originale se il testo è pubblicato per la prima volta, traduzione se si tratta di una traduzione e riscrittura se si tratta della pubblicazione di un testo scritto in passato e che viene riproposto.] ____;0;? [Si inserisce italiano se il testo è una traduzione, altrimenti si attibuisce valore 0. ] (aaaa,mm;0;?,gg;0;?),0;? [Si inserisce la data, se nota, in cui è comparso l'originale la cui traduzione confluisce nel corpus, altrimenti si attribuisce valore 0. ] (aaaa,mm;0;?,gg;0;?),0;? [Si inserisce la data in cui è comparsa la traduzione che confluisce nel corpus, altrimenti si attribuisce valore 0.] (aaaa,mm;0;?,gg;0;?),0;? (aaaa,mm;0;?,gg;0;?),0;? [Normalmente questi due tag assumono valore 0 e si riferiscono rispettivamente alla data di composizione del testo in lingua originale di cui abbiamo la traduzione che confluisce nel corpus e alla data di composizione della traduzione con cui abbiamo a che fare.] orig;origFC;origCE;copia;copiaOCR;derEdE;bozzeAutE [ Per Ath e Newsl Si attribuisce di default derEdE.] nome1.jpg;0,nome2.jpg;0 [Si attribuisce di default 0.] [All'interno di body si inserisce il testo markuppato comprensivo di titolo, corpo del testo, note e indicazioni bibliografiche.] ======================================================================== COMBINAZIONI DI Headers RELATIVE AL TIPO DI TESTO UTILIZZATE NORMALMENTE Per L'Ateneo. art saggL divulg per articoli di ambito umanistico con fini divulgativi. art saggL spec per articoli di ambito umanistico di dominio specialistico. art saggL celeb per gli interventi in ambito umanistico di coloro che sono stati insigniti della laurea honoris causa. art saggS divulg per articoli di ambito scientifico con fini divulgativi. art saggS spec per articoli di ambito scientifico di dominio specialistico. art saggS celeb per gli interventi in ambito scientifico di coloro che sono stati insigniti della laurea honoris causa. art saggS inform per articoli di ambito scientifico (es. statistiche, indagini, ecc...) con fini informativi. art giorn inform per le Presentazioni dei numeri di Ateneo da parte della redazione. art acc celeb per le laudatio rivolte a coloro che sono stati insigniti della laurea honoris causa. bio document inform per le biografie composte dalla redazione di coloro che sono stati insigniti della laurea honoris causa. bio document celeb per le biografie redatte in ricordo di personaggi. ============================================================ MARKUP TAGS NUOVI O SPECIFICATI PER L'ATHENAEUM CORPUS *** Intestazione *** In una lettera e/o circolare amministrativa e/o commerciale è l'intestazione del mittente (a volte fissata nella carta intestata) con logo, ragione sociale, ufficio, recapiti e/o simili. Es. LG UNIVERSITÀ DEGLI STUDI DI TORINO AREA RICERCA E RELAZIONI INTERNAZIONALI Sezione Ricerca Scientifica Unità Operativa: Ricerca Istituzionale Via Bogino 9 Tel. 011- 6702458 Fax 011 – 6702453 e.mail : fondi.ricerca@rettorato.unito.it *** Protocollo *** Le formule iniziali di una lettera o di un'allocuzione, es. Caro Pippo, come stai? Alle segreterie di dipartimento. Con la presente si trasmette l'organigramma mandorlato dei quadri appesi al muro. Gentile signore e signori! Siamo qui riuniti sulla pubblica piazza per farci un po' del male. *** Escatocollo *** Le formule di congedo di una lettera o di un'allocuzione, es. Cari saluti, Pippo Grazie per avermi ascoltato, ed arrivederci alla prossima conferenza. *** Signature lines e Sezione finale con firme elettroniche, ASCII Art ecc. del , individuata in blocco con . Cordiali saluti, AsdrubaLE Asdrubale Pastrufazio InfoScript s.r.l. Perl aid team _ IN PERL .--' | WE TRUST /___^ | .--. ) | / \ / | /` '. | '-' / \ \asdru-pasdru |\ \ / \ /\| \ /'----`\ / ||| \\ | ((| ((| ||| ||| //_( //_( ---- VIA PIRLIK 9 - 90999 CHISSADOVE (HM) TEL. 099-999.9999 - FAX 099-999.9998 ORARIO UFFICIO: dal LUN al VEN ore 9.00-11.00 MART e GIO 14.00-15.30 Le singole righe sono poi automaticamente numerate e marcate con . Es: Cordiali saluti, AsdrubaLE 24 *** post scripta *** il testo aggiunto in lettere ed emails dopo l'escatocollo. sovente è esplicitamente segnato già nel teso con PS, PPS ecc. *** Disegni *** La presenza di disegni può essere resa da un set limitato di sigle convenzionali; a quelle proposte per Valico, SG “segno grafico” generico (per ogni altro disegno-carattere, tipo faccine, fulmini, ecc.), DN (per disegni naturalistici estesi anche su più righe), DT (per disegni tecnici, come un pezzo di circuito elettrico), DS (per diagrammi schematici, tipo schema a blocchi, ecc.), si aggiunga LG logo di una ditta od istituzione. Se i disegni non sono rilevanti per la comprensione del testo è sufficiente sostituirli con le rispettive sigle, senza acquisirli otticamente. Le sigle vanno chiuse nel tag , al modo seguente: La stella SG a sei punte è formata da due triangoli sovrapposti. *** Abstract *** *** Keyword *** *** Epigrafe *** L'epigrafe è posta fuori da paragrafi e capitoli. *** Citazione *** Si usa per frasi o porzioni di testo, non per testi completi (o loro sezioni ampie, significative e compiute). *** Citazione annidata *** Si usa quando si debba marcare una citazione DENTRO un'altra citazione. Es: Come scrive il Testacalda : " Secondo Pomponazzi, che scriveva 'ciao ! ', Aristotele pescava le trote con la lenza " *** Testo riportato *** Nel caso di testi completi riportati come appendice o simili, questi sono stati portati fuori come file indipendenti per potergli attribuire una header. Nel file sorgente al loro posto compare un Anchor con href al nome del nuovo file; nella header del file nuovo compare compilata la riga doc-id_source>nomefile;0 con il nome del file sorgente. Il trattamento è evidentemente provvisorio, perché nel trattamento attuale i nomi dei file scompaiono, ma è almeno un tibicinum per una futura implementazione "buona". Nel caso di testi sia pure completi (o loro sezioni ampie, significative e compiute) che siano inclusi nel testo principale ma che ne siano in qualche modo parte necessaria per ora non si è proceduto all'estrapolazione, ma li si è marcati con il tag , facendocene elenco distinto: 20_17=Carlo_LIZZANI_discorso_02.rtf Tutta la questione è da rivedere a bocce ferme. *** Bibliografia *** Se interna al volume e non di copertina. *** 2a di copertina <2cop> *** Si intende di default redazionale e non dell'autore del testo. *** 4a di copertina <4cop> *** Si intende di default redazionale e non dell'autore del testo; alla 4a di copertina sono anche assimilati tutti i commenti e le avvertenze redazionali stampati in calce al testo. Non si usa il tag (cf. Brusacoeur) perché non di dafault redazionale. *** premessa *** Se interna al volume e non di copertina. Si intende di default redazionale e non dell'autore del testo. *** biografia *** Se interna al volume e non di copertina. Si intende di default redazionale e non dell'autore del testo. *** richiamo *** Per articoli che hanno un riquadro separato di richiamo del testo, contenente o un sunto dell'articolo o il programma dello spettacolo cui l'articolo si riferisce, o simili ... Probabilmente nel gergo giornalistico il "coso" in qustione ha un nome, e se mai lo scopriremo lo useremo ... *** indice *** Nei casi in cui sia presente un indice, e questo sia sufficientemente esteso, può essere mantenuto se compreso nel tag al cui interno la paragrafatura è indipendente dal testo successivo. *** Discorso diretto *** Esempio: E Giorgio disse: " Oh basta là " *** Frasi straniere *** Saranno markuppate non le singole parole eventualmente presenti in frasi altrimenti in italiano (come distinguere i prestiti non adattati?), ma solo i sintagmi, le frasi od i paragrafi effettivamente non in italiano. *** indirizzi mail adress@mah.com *** Marca gli indirizzi mail. *** indirizzi web *** Marca gli indirizzi web. *** indirizzi telefono *** Marca i numeri di telefono e fax. *** Titolo [brano, paragrafo, capitolo] *** *** Parti in versi *** *** Livelli di marcatura del testo *** Tipo Obbligatorio Simbolo _______________________________________________ Libro NO lib ¥___¥ =titolo tit =capo cap =sezione sez Capitolo=Art SI c-a %___% SottoCap1 NO sc1 &___& SottoCap2 NO sc2 ‰___‰ Sottocap3 NO sc3 £___£ [??] Sottocap4 NO sc4 ¢___¢ [??] Paragrafo=c. SI p-c #___# In questo modo sono stati definiti 2 livelli (Capitolo, Paragrafo) che devono obbligatoriamnete essere marcati per ciascun testo, gli altri sono opzionali e permettono di identificare le diverse tipologie di testi riscontrabili; vanno applicati secondo l'ordine della gerarchia (prima il subcap1, poi se necessario il subcap2 ecc.); se se ne presentasse il caso, altre sottocategorie potranno essere introdotte = sono le proposte ler il corpus legale *** Elenco *** La sintassi generale del tag è la seguente: Elemento marcante Testo Il testo dell'elenco deve a sua volta essere contrassegnato adeguatamente (ad es. se è un paragrafo sarà marcato con #___# ecc.) Ess: Testo originale: 1. testo prima linea 2. testo seconda linea Testo marcato: 1. testo prima linea 2. testo seconda linea Testo originale: 1. testo prima linea lungo e significativo 2. testo seconda linea lungo e significativo Testo marcato: #___# 1. testo prima linea lungo e significativo #___# 2. testo seconda linea lungo e significativo Testo originale: 1. testo a volte articolato in paragrafi 1.1 testo a volte articolato in paragrafi Testo marcato: %001% 1. #001# testo ‰002‰ 2. #001# testo Testo originale: 1. Titolo capitolo 1 dell'articolo 1.1 Titolo sottocapitolo 1 dell'articolo Testo marcato: %001% 1. Titolo capitolo 1 dell'articolo ‰001‰ 1.1 Titolo sottocapitolo 1 dell'articolo Semplici elenchi a lista senza punti elenco o simili non riceveranno ma saranno trattati come semplici righe (ed il nuovo paragrafo sarà riservato solo per elenchi le cui voci siano blocchi di frasi e non semplici liste). Ad es. #___# Le opere migliori, oggetto della mostra organizzata nei locali del Dipartimento di Biologia animale e dell’uomo a corollario del convegno di presentazione del Calendario, sono state realizzate da: Elisabetta Berra Rosanna Gigantiello Mauro Mantovani Giovanna Minoggio Maria Nazario Giulia Nomis Elena Pogliano Martina Tardi Luca Zanvercelli #___# *** Pagine *** Le pagine vengono marcate con un $001$ ecc. all’inizio di ogni pagina. Le pagine in cifre romane vengono marcate con un $R001$ ecc. all’inizio di ogni pagina. *** Note *** %001% [...] #002# Ai locali in uso all’Università e all’Accademia di Medicina si accede da un piccolo portone aperto nell’800 in forme neoclassiche sotto i portici di via Po al n° 18, che certo non spicca tra le aggressive vetrine dei negozi che lo assediano. Il cortile che così si raggiunge fu il chiostro con giardino del Convento, oggi appena percepibile a causa delle profonde trasformazioni che ha subito nel tempo, soprattutto a partire dall’800: le arcate di tre dei quattro lati sono state via via chiuse in vario modo, quelle centrali del lato sud sono in parte scomparse. Si percorre a sinistra il portico del chiostro nel tratto delle tre arcate ancora aperte e si raggiunge uno scalone sormontato da cupola con tamburo ottagonale e lanterna in cui domina una Crocefissione, affresco attribuito al Guidobono (2) (foto B). %003%NOTE [...] #002# (2)Nel 2000 l’affresco viene ricollocato, dopo essere stato restaurato, sulla parete da dove era stato staccato nel 1970 perché gravemente danneggiato. Il restauro dell’affresco si deve all’Accademia di Medicina con il contributo della Fondazione CRT. All’Università degli Studi di Torino si deve il restauro della cupola e dello scalone. Si badi che per esigenze delle scripts di preparazione del corpus la stringa _ non deve mai essere spezzata su due righe. *** Evidenziazioni *** corsivo __ I valori previsti sono corsivo normale “i” e grassetto corsivo “bi” grassetto rappresentato con __ I valori previsti sono corsivo normale “b” ed extra-bold “bb” sottolineato __ I valori previsti sono singolo “u1”, doppio “u2” e triplo “u3” tratteggiato __ I valori previsti sono singolo “h1”, doppio “h2” e triplo “h3” puntinato __ I valori previsti sono singolo “d1”, doppio “d2” e triplo “d3” maiuscoletto è rappresentato con __ Il valore previsto è solo “sc” (small capitals) espanso è rappresentato con __ Il valore previsto è solo “xp” (expanded) apice/pedice è rappresentato con __ I valore previsti sono solo “ap” (apice) e “pd” (pedice) I codici sono combinabili solo con tags distinti, per cui un maiuscoletto grassetto corsivo spaziato sarebbe __ *** Colori diversi *** L'uso intenzionale di colori diversi nel testo può essere rappresentato con il tag __. *** formule matematiche *** le espressioni numerico-matematiche o comunque in cifre, ad esclusione dei semplici numerali "linguistici" espressi in cifre anziché in lettere e dei punti-elenco, sono contrassegnate con . Quindi avremo “voglio 15 giorni di vacanza” e “1.” senza marche ma “15 + 3 / 2 = 8 è sbagliato” con marca.