HEADER COMMENTATA
[Estremi identificativi del documento]
-----
ansi;unicode
[Codifica caratteri: nel caso del Corpus d'Ateneo, la codifica è ansi.]
____
[Si intende di default la lingua italiana in quanto il corpus è composto da
testi in lingua italiana.]
(nome;?,cognome;?),(nome;?,cognome;?),…
[Si inserisce il nome dell'autore. In caso di più autori si inseriscono le
informazioni come nel tag soprastante, altrimenti nome,cognome senza parentesi.]
nick;0,adress [=From]
(nick;0,adress);(nick;0,adress) [=To]
[i due tags ono importati da NG e servono o per le lerre ed email o per articoli
scritti con nom de plume; cfr l'art. firmato "gatto lupesco" in Newsletter VII
(2004) 3].
(nome;?,cognome;?);0,(nome;?,cognome;?),…
[Se necessario si inserisce il nome e il cognome del traduttore nello stesso
identico modo indicato per l'autore, altrimenti si attribuisce 0 al tag in
quanto non pertinente.]
(nome,cognome);ente
[default: Ufficio Stampa dell'Università degli Studi di Torino]
____;0;?
[Si inserisce il titolo del testo. E'possibile abbreviarlo in caso di eccessiva
lunghezza. In caso sia assente si pone un titolo redazionale.]
(aaaa,mm;0;?,gg;0;?);(0;?)
[Data della composizione del testo o di quando il testo è stato pronunciato.
Quando un valore non è noto si inserisce ? altrimenti 0 se il valore non è
pertinente.]
città;?,nazione,?
[Luogo in cui il testo è stato composto o pronunciato con l'abbreviazione della
nazione. Per Ateneo i testi si intendono di default Torino,IT]
scuola
Università degli studi di Torino
[Estremi identificativi della fonte da cui sono stati tratti i testi.]
____
[Si inserisce Ateneo. Il nome ufficiale Athenaeum sarà sostituito via script per
evitare errorri di battitura.]
riv;vol;read;NG;altro;0;?
[Riv di default]
nomefile;0
[Si inserisce il nome del file in cui viene incollato un eventuale testo
riportato, altrimenti se il campo non è pertinente si attribuisce valore zero.
Nel file contenente il testo riportato si inserisce un link al file originario
da cui il testo è stato spostato.]
titoloRiv;titoloVol;titoloRead;nomeNG;nomeAltro;0;?
[default: l'Ateneo - notiziario dell'Università degli studi di Torino]
[default: Dall'Università - Notiziario dell'Università degli studi di Torino]
(annata_nnn;0;?,fasc_n;0;?,npf_nnn;0;?,suppl;0,pag_nnnn-
nnnn;0;?),0;?
[Si inseriscono gli estremi della rivista Ateneo: l'annata in numeri romani, il
numero della rivista, il numero progressivo del fascicolo (che appare sulla
copertina e che non corrisponde al numero del fascicolo), l'eventuale
annotazione del supplemento e il numero delle pagine dalla prima all'ultima in
cui il testo è stampato sul numero cartaceo.]
volume_nn-nn;?,pag_nnnn-nnnn;?,0;?
[si attribuisce sempre 0]
nomecollana,0;?
[si attribuisce sempre 0]
(aaaa,mm;0;?,gg;0;?);(0;?)
[Si inserisce la data di uscita della rivista. Nel nostro caso il formato della
data è: aaaa,mm-mm,0]
____
[Si intende di default Torino in quanto la rivista viene stampata a Torino.]
editore;sitoweb;usenet;0;?
[default: Università degli studi di Torino]
1;2;…,g1;nInterv×Convegno
____;0
[Se il numero ha al suo interno delle monografie, cioè degli articoli
raggruppati con un titolo, oppure se riporta alcuni interventi relativi a un
convegno occorre prestare molta attenzione ai tag gruppo_num e gruppo_nome.
Se ci sono ad esempio 10 articoli relativi a un convegno su Massimo Mila (ved.
il numero 12 di Ateneo) al primo articolo occorre inserire all'interno di
gruppo_num 1,g10 al secondo 2,g10 al terzo 3,g10 e così via e a gruppo_nome
inserire il nome che la rivista dà al monografico o il nome del convegno cui
appartengono gli atti. In questo caso è "Numero monografico dedicato a Massimo
Mila" e quindi in gruppo_nome occorre inserire numero monografico
dedicato a Massimo Mila.
Attenzione! Per gli articoli singoli occorre sempre inserire 1,g1 all'interno di
gruppo_num e 0 all'interno di gruppo_nome.
LO stesso vale per le sezioni o rubriche fisse di un giornale (cfr. la
newsletter).]
m;f;?;ente;gruppo
1-7;8-13;14-18;19-25;26-30;30-40;40-50;oltre;?
___;0;?
___;?
1;2;3;?
____;?,____;0;?
____;0;?
[Si inseriscono i dati relativi all'autore: il sesso, l'organizzazione cui
appartiene, la mansione ricoperta al suo interno. Normalmente in Ateneo l'età e
lo status presentano sempre ?. In lingua1 si inserisce italiano e ? in lingue.]
ripeti_autore_o_canc
ripeti_autore_o_canc
[Questi due tag soprastanti si utilizzano nel caso in cui il testo sia stato
scritto da più autori.]
m;f;?;ente;gruppo;0
1-7;8-13;14-18;19-25;26-30;30-40;40-50;oltre;?;0
1;2;3;?;0
____;?,____;0;?
____;0;?
[Si inseriscono se necessario le specifiche relative al traduttore (i cui tag
presenti sono identici a quelli relativi all'autore per quanto riguarda la loro
compilazione) altrimenti si attribuisce valore 0.]
ripeti_traduttore_o_canc
ripeti_traduttore_o_canc
[Questi due tag soprastanti si utilizzano nel caso in cui il testo sia stato
tradotto da un gruppo composto da più traduttori.]
c-lib;tes;dial;ques;es-
trad;dett;rias;email;lett;mgraf;art;rec;rom;nov;poem
[Normalmente ai testi del Corpus d'Ateneo si attribuisce art. Nel caso di
biografie di coloro che sono stati insigniti della laurea honoris causa si
attribuisce bio. (vedere in fondo le combinazioni di tag utilizzate normalmente
per i testi del Corpus d'Ateneo).
Nel caso (Newsletter) di recensioni librarie e cronache - comptes rendus - di
convegni si usa rec.
+ categorie del corpus IUS già introdotte: reg, docPr
[[In generale si tenga presente che:
per tstile legisl e tfine regol i ttipo attualmente presenti in IUS e
importabili in ateneo sono:
l legge ordinaria
lr legge regionlae
dl decreto legge
dlgs decreto legislativo
dm decreto ministeriale
dpcm decreto del Presidente del Consiglio dei ministri
dpvcm decreto del vicePresidente del Consiglio dei ministri
dpr decreto del Presidente della Repubblica
dim decreto interministeriale
ddg decreto dirigenziale
ddr decreto direttoriale
dcsm decreto Consiglio superiore della magistratura
c circolare
n nota
cm comunicazione
dir direttiva
dis disposizione
det determinazione
prp proposta
prv provvedimento
rel relazione
ord ordinanza
reg regolamento
+
docPr documento programmatico (manifesti, carte)
]]]
Il docPr è stato introdotto per la carta di Torino su Uni e ricerca in
Newsletter, cui è stata daTA LA COMBINAZIONE:
docPr
amm
regol
saggL;saggS;giorn;man;amm;legisl;acc
[In caso {Ath,New} di un testo riguardante argomenti di carattere umanistico si
attribuisce saggL. Al contrario per testi riguardanti argomenti scientifici si
attribuisce saggS {Ath,New} . giorn viene utilizzato {Ath} nel caso delle
presentazioni dei numeri della rivista scritte dalla redazione o {New} in
articoli in cui prevalga l'aspetto di cronaca. acc viene utilizzato per le
laudatio {Ath} e document per le biografie di coloro che sono stati insigniti
della laurea honoris causa {Ath} o ___ {New} .
(vedere in fondo le combinazioni di tag utilizzate normalmente per i testi del
Corpus d'Ateneo).]
divulg;spec;artist;intratt;inform;regol;celeb
[Viene utilizzato divulg se il fine del testo è divulgativo, altrimenti spec se
il testo è di carattere specialistico. inform viene utilizzato se il testo è di
carattere informativo e celeb se di carattere celebrativo come nel nostro caso
per le laudatio {Ath} o biografie commemorative encomiastiche {New}. (vedere in
fondo le combinazioni di tag utilizzate normalmente per i testi del Corpus
d'Ateneo)]
...
[da definire]
____,____,____,____,____
[Devono essere obbligatoriamente inserite 5 parole chiave relative agli
argomenti trattati nel testo markuppato.]
originale;traduzione;riscrittura
[Si utilizza originale se il testo è pubblicato per la prima volta, traduzione
se si tratta di una traduzione e riscrittura se si tratta della pubblicazione di
un testo scritto in passato e che viene riproposto.]
____;0;?
[Si utilizza originale se il testo è pubblicato per la prima volta, traduzione
se si tratta di una traduzione e riscrittura se si tratta della pubblicazione di
un testo scritto in passato e che viene riproposto.]
____;0;?
[Si inserisce italiano se il testo è una traduzione, altrimenti si attibuisce
valore 0. ]
(aaaa,mm;0;?,gg;0;?),0;?
[Si inserisce la data, se nota, in cui è comparso l'originale la cui traduzione
confluisce nel corpus, altrimenti si attribuisce valore 0. ]
(aaaa,mm;0;?,gg;0;?),0;?
[Si inserisce la data in cui è comparsa la traduzione che confluisce nel corpus,
altrimenti si attribuisce valore 0.]
(aaaa,mm;0;?,gg;0;?),0;?
(aaaa,mm;0;?,gg;0;?),0;?
[Normalmente questi due tag assumono valore 0 e si riferiscono rispettivamente
alla data di composizione del testo in lingua originale di cui abbiamo la
traduzione che confluisce nel corpus e alla data di composizione della
traduzione con cui abbiamo a che fare.]
orig;origFC;origCE;copia;copiaOCR;derEdE;bozzeAutE
[ Per Ath e Newsl Si attribuisce di default derEdE.]
[
nome1.jpg;0,nome2.jpg;0
]
[Si attribuisce di default 0.]
[All'interno di body si inserisce il testo markuppato comprensivo di titolo,
corpo del testo, note e indicazioni bibliografiche.]
========================================================================
COMBINAZIONI DI Headers RELATIVE AL TIPO DI TESTO UTILIZZATE NORMALMENTE Per
L'Ateneo.
art
saggL
divulg
per articoli di ambito umanistico con fini divulgativi.
art
saggL
spec
per articoli di ambito umanistico di dominio specialistico.
art
saggL
celeb
per gli interventi in ambito umanistico di coloro che sono stati insigniti della
laurea honoris causa.
art
saggS
divulg
per articoli di ambito scientifico con fini divulgativi.
art
saggS
spec
per articoli di ambito scientifico di dominio specialistico.
art
saggS
celeb
per gli interventi in ambito scientifico di coloro che sono stati insigniti
della laurea honoris causa.
art
saggS
inform
per articoli di ambito scientifico (es. statistiche, indagini, ecc...) con fini
informativi.
art
giorn
inform
per le Presentazioni dei numeri di Ateneo da parte della redazione.
art
acc
celeb
per le laudatio rivolte a coloro che sono stati insigniti della laurea honoris
causa.
bio
document
inform
per le biografie composte dalla redazione di coloro che sono stati insigniti
della laurea honoris causa.
bio
document
celeb
per le biografie redatte in ricordo di personaggi.
============================================================
MARKUP
TAGS NUOVI O SPECIFICATI PER L'ATHENAEUM CORPUS
*** Intestazione ***
In una lettera e/o circolare amministrativa e/o commerciale
è l'intestazione del mittente (a volte fissata nella carta intestata)
con logo, ragione sociale, ufficio, recapiti e/o simili. Es.
LG UNIVERSITÀ DEGLI STUDI DI TORINO
AREA RICERCA E RELAZIONI INTERNAZIONALI
Sezione Ricerca Scientifica
Unità Operativa: Ricerca Istituzionale
Via Bogino 9
Tel. 011- 6702458
Fax 011 – 6702453
e.mail : fondi.ricerca@rettorato.unito.it
*** Protocollo ***
Le formule iniziali di una lettera o di un'allocuzione, es.
Caro Pippo,
come stai?
Alle segreterie di dipartimento.
Con la presente si trasmette l'organigramma mandorlato dei quadri appesi al
muro.
Gentile signore e signori!
Siamo qui riuniti sulla pubblica piazza per farci un po' del male.
*** Escatocollo ***
Le formule di congedo di una lettera o di un'allocuzione, es.
Cari saluti,
Pippo
Grazie per avermi ascoltato, ed arrivederci alla prossima
conferenza.
*** Signature lines e
Sezione finale con firme elettroniche, ASCII Art ecc. del ,
individuata in blocco con .
Cordiali saluti,
AsdrubaLE
Asdrubale Pastrufazio
InfoScript s.r.l.
Perl aid team
_ IN PERL
.--' | WE TRUST
/___^ | .--.
) | / \
/ | /` '.
| '-' / \
\asdru-pasdru |\
\ / \ /\|
\ /'----`\ /
||| \\ |
((| ((|
||| |||
//_( //_(
----
VIA PIRLIK 9 - 90999 CHISSADOVE (HM)
TEL. 099-999.9999 - FAX 099-999.9998
ORARIO UFFICIO: dal LUN al VEN ore 9.00-11.00
MART e GIO 14.00-15.30
Le singole righe sono poi automaticamente numerate e marcate con . Es:
Cordiali saluti,
AsdrubaLE
24
*** post scripta ***
il testo aggiunto in lettere ed emails dopo l'escatocollo.
sovente è esplicitamente segnato già nel teso con PS, PPS ecc.
*** Disegni ***
La presenza di disegni può essere resa da un set limitato di sigle
convenzionali; a quelle proposte per Valico,
SG “segno grafico” generico (per ogni altro disegno-carattere, tipo faccine,
fulmini, ecc.),
DN (per disegni naturalistici estesi anche su più righe),
DT (per disegni tecnici, come un pezzo di circuito elettrico),
DS (per diagrammi schematici, tipo schema a blocchi, ecc.),
si aggiunga
LG logo di una ditta od istituzione.
Se i disegni non sono rilevanti per la comprensione del testo è
sufficiente sostituirli con le rispettive sigle, senza acquisirli
otticamente.
Le sigle vanno chiuse nel tag , al modo seguente:
La stella SG a sei punte è formata da due triangoli
sovrapposti.
*** Abstract ***
*** Keyword ***
*** Epigrafe ***
L'epigrafe è posta fuori da paragrafi e capitoli.
*** Citazione ***
Si usa per frasi o porzioni di testo, non per testi
completi (o loro sezioni ampie, significative e compiute).
*** Citazione annidata ***
Si usa quando si debba marcare una citazione DENTRO un'altra citazione.
Es: Come scrive il Testacalda : " Secondo Pomponazzi, che scriveva
'ciao ! ', Aristotele pescava le trote con la lenza "
*** Testo riportato ***
Nel caso di testi completi riportati come appendice o simili, questi sono stati
portati
fuori come file indipendenti per potergli attribuire una header. Nel file
sorgente al loro posto
compare un Anchor con href al nome del nuovo file; nella header del file nuovo
compare compilata la riga
doc-id_source>nomefile;0
con il nome del file sorgente.
Il trattamento è evidentemente provvisorio, perché nel trattamento
attuale i nomi dei file scompaiono, ma è almeno un tibicinum per una futura
implementazione "buona".
Nel caso di testi sia pure completi (o loro sezioni ampie,
significative e compiute) che siano inclusi nel testo
principale ma che ne siano in qualche modo parte necessaria
per ora non si è proceduto all'estrapolazione, ma li si è marcati
con il tag , facendocene elenco distinto:
20_17=Carlo_LIZZANI_discorso_02.rtf
Tutta la questione è da rivedere a bocce ferme.
*** Bibliografia ***
Se interna al volume e non di copertina.
*** 2a di copertina <2cop> ***
Si intende di default redazionale e non dell'autore del testo.
*** 4a di copertina <4cop> ***
Si intende di default redazionale e non dell'autore del testo;
alla 4a di copertina sono anche assimilati tutti i commenti e le avvertenze
redazionali stampati in calce al testo. Non si usa il tag (cf.
Brusacoeur)
perché non di dafault redazionale.
*** premessa ***
Se interna al volume e non di copertina.
Si intende di default redazionale e non dell'autore del testo.
*** biografia ***
Se interna al volume e non di copertina.
Si intende di default redazionale e non dell'autore del testo.
*** richiamo ***
Per articoli che hanno un riquadro separato di richiamo del testo, contenente o
un sunto dell'articolo o il programma dello spettacolo cui l'articolo si
riferisce, o simili ... Probabilmente nel gergo giornalistico il "coso" in
qustione ha un nome, e se mai lo scopriremo lo useremo ...
*** indice ***
Nei casi in cui sia presente un indice, e questo sia sufficientemente esteso,
può essere mantenuto se
compreso nel tag al cui interno la paragrafatura è
indipendente dal testo successivo.
*** Discorso diretto ***
Esempio: E Giorgio disse: " Oh basta là "
*** Frasi straniere ***
Saranno markuppate non le singole parole eventualmente presenti in frasi
altrimenti in italiano (come distinguere i prestiti non adattati?), ma
solo i sintagmi, le frasi od i paragrafi effettivamente non in italiano.
*** indirizzi mail adress@mah.com ***
Marca gli indirizzi mail.
*** indirizzi web ***
Marca gli indirizzi web.
*** indirizzi telefono ***
Marca i numeri di telefono e fax.
*** Titolo [brano, paragrafo, capitolo] ***
*** Parti in versi ***
*** Livelli di marcatura del testo ***
Tipo Obbligatorio Simbolo
_______________________________________________
Libro NO lib ¥___¥
=titolo tit
=capo cap
=sezione sez
Capitolo=Art SI c-a %___%
SottoCap1 NO sc1 &___&
SottoCap2 NO sc2 ‰___‰
Sottocap3 NO sc3 £___£ [??]
Sottocap4 NO sc4 ¢___¢ [??]
Paragrafo=c. SI p-c #___#
In questo modo sono stati definiti 2 livelli (Capitolo, Paragrafo)
che devono obbligatoriamnete essere marcati per ciascun testo,
gli altri sono opzionali e permettono di identificare le diverse
tipologie di testi riscontrabili; vanno applicati secondo l'ordine
della gerarchia (prima il subcap1, poi se necessario il subcap2 ecc.);
se se ne presentasse il caso, altre sottocategorie potranno essere
introdotte
= sono le proposte ler il corpus legale
*** Elenco ***
La sintassi generale del tag è la seguente:
Elemento marcante Testo
Il testo dell'elenco deve a sua volta essere contrassegnato adeguatamente
(ad es. se è un paragrafo sarà marcato con #___# ecc.)
Ess:
Testo originale:
1. testo prima linea
2. testo seconda linea
Testo marcato:
1. testo prima linea
2. testo seconda linea
Testo originale:
1. testo prima linea lungo e significativo
2. testo seconda linea lungo e significativo
Testo marcato:
#___# 1. testo prima linea lungo e significativo
#___# 2. testo seconda linea lungo e significativo
Testo originale:
1. testo a volte articolato in paragrafi
1.1 testo a volte articolato in paragrafi
Testo marcato:
%001% 1. #001# testo
‰002‰ 2. #001# testo
Testo originale:
1. Titolo capitolo 1 dell'articolo
1.1 Titolo sottocapitolo 1 dell'articolo
Testo marcato:
%001% 1. Titolo capitolo 1 dell'articolo
‰001‰ 1.1 Titolo sottocapitolo 1 dell'articolo
Semplici elenchi a lista senza punti elenco o simili non riceveranno ma
saranno trattati come semplici righe (ed il nuovo paragrafo sarà riservato solo
per elenchi le cui voci siano blocchi di frasi e non semplici liste). Ad es.
#___# Le opere migliori, oggetto della mostra organizzata nei locali del
Dipartimento di Biologia animale e dell’uomo a corollario del convegno di
presentazione del Calendario, sono state realizzate da:
Elisabetta Berra
Rosanna Gigantiello
Mauro Mantovani
Giovanna Minoggio
Maria Nazario
Giulia Nomis
Elena Pogliano
Martina Tardi
Luca Zanvercelli
#___#
*** Pagine ***
Le pagine vengono marcate con un $001$ ecc. all’inizio di ogni pagina.
Le pagine in cifre romane vengono marcate con un $R001$ ecc. all’inizio di ogni
pagina.
*** Note ***
%001% [...]
#002# Ai locali in uso all’Università e all’Accademia di Medicina si accede da
un piccolo portone aperto
nell’800 in forme neoclassiche sotto i portici di via Po al n° 18, che certo non
spicca tra le aggressive vetrine dei
negozi che lo assediano. Il cortile che così si raggiunge fu il chiostro con
giardino del Convento, oggi appena
percepibile a causa delle profonde trasformazioni che ha subito nel tempo,
soprattutto a partire dall’800: le arcate
di tre dei quattro lati sono state via via chiuse in vario modo, quelle centrali
del lato sud sono in parte scomparse.
Si percorre a sinistra il portico del chiostro nel tratto delle tre arcate
ancora aperte e si raggiunge uno scalone
sormontato da cupola con tamburo ottagonale e lanterna in cui domina una
Crocefissione, affresco attribuito al
Guidobono (2) (foto B).
%003%NOTE
[...]
#002# (2)Nel 2000 l’affresco viene ricollocato, dopo
essere stato restaurato, sulla parete da dove era stato staccato nel 1970 perché
gravemente danneggiato. Il restauro dell’affresco si deve all’Accademia di
Medicina con il contributo della Fondazione CRT. All’Università degli Studi di
Torino si deve il restauro della cupola e dello scalone.
Si badi che per esigenze delle scripts di preparazione del corpus la stringa _ non deve mai essere spezzata su due righe.
*** Evidenziazioni ***
corsivo __
I valori previsti sono corsivo normale “i” e grassetto corsivo “bi”
grassetto rappresentato con __
I valori previsti sono corsivo normale “b” ed extra-bold “bb”
sottolineato __
I valori previsti sono singolo “u1”, doppio “u2” e triplo “u3”
tratteggiato __
I valori previsti sono singolo “h1”, doppio “h2” e triplo “h3”
puntinato __
I valori previsti sono singolo “d1”, doppio “d2” e triplo “d3”
maiuscoletto è rappresentato con __
Il valore previsto è solo “sc” (small capitals)
espanso è rappresentato con __
Il valore previsto è solo “xp” (expanded)
apice/pedice è rappresentato con __
I valore previsti sono solo “ap” (apice) e “pd” (pedice)
I codici sono combinabili solo con tags distinti, per cui un maiuscoletto
grassetto corsivo spaziato
sarebbe
__
*** Colori diversi ***
L'uso intenzionale di colori diversi nel testo può essere rappresentato con
il tag __.
*** formule matematiche ***
le espressioni numerico-matematiche o comunque in cifre, ad esclusione dei
semplici numerali "linguistici" espressi in cifre anziché in lettere e dei
punti-elenco, sono contrassegnate con . Quindi avremo “voglio 15 giorni di
vacanza” e “1.” senza marche ma “15 + 3 / 2 = 8 è sbagliato”
con marca.