Definizione Workflow per esigenze del CNR

From Servizi RSI
Jump to: navigation, search
Progettazione Workflow e Gestione Documentale
Edgardo Ambrosi


In merito all'attività di avviare in maniera efficace l'automazione dei flussi informativi relativi al sistema informativo del CNR, la base e punto di partenza dell'attività è la piattaforma Alfresco scelta dal soggetto. In particolare, resta importante ricordare che Alfresco piu' che un pordottoprodotto è un semiprodotto, in quanto le funzionalità offerte sono relative ad una serie di sottoprodotti opensource stabili. Questa particolarità ci consentirà di capirne meglio i meccanismi e di concentrarci solo sulle funzionalità di cui abbiamo realmente bisogno per la gestione die flussi informativi. In particolare, la presente attività vuole investigare, ma soprattutto mettere  in atto, una serie di procedure volte alle gestione semi-automatica dell'informazione all'interno dell'CNR. Per informazione, intendiamo  qualunque oggetto che porti contenuto informativo. Tale contenuto informativo rappresenta il dominio di due principali attività  importanti e strategiche. Workflow e Gestione Documentale.

Workflow

In questa prima fase ci interessiamo dei workflow. Ovviamente la parte diciamo "teorica" resta uno dei punti cardine da valutare, in quanto ci consente di avere una chiara visione delle potenzialità e dei limiti di tale ambiente che coinvolge :

  • progettazione dei flussi,
  • implementazione,
  • controllo,
  • e cooperazione umana (che resta il punto cardine), etc.
La modularità della piattaforma ci consentirà, l'integrazione di ulteriori funzionalità con le componenti del sistema gia'già esistenti. L'impatto derivante dall'uso di workflow all'interno del CNR riguarda sia il sistema ITC in generale che le risorse umane. I motori di gestione dei workflow si appoggiano su implemetazioniimplementazioni aperte e su standard riconosciuti ufficiali o "de facto", che ne garantiscono la cooperazione interoperabilità con sistemi  esperti quali DB tipo Oracle, e sistemi decisionali tipo SAP, nonchè con sistemi per la gestione contabile e amministrativa.
Per impostare una sperimentazione significativa Sulla base della definizione di Workflow dobbiamo raccogliere una prima forma di requisiti è necessario individuare un paio workflow reali per i quali effettuare la raccolta dei requisiti e la successiva automatizzazione tramite Alfresco. Tali flussi di lavoro dovranno coinvolgere utenti umani e componenti del sistema informativo. necessari per il disegno di due casi di studio basati sul sistema informativo del CNR, quindi individuare due flussi di operazioni, in termini diPer ciascun flusso si dovranno individuare:
  • organizzazioni di staff, o
  • macchinesistemi hardware e/o software.
  • gruppi di lavoro di persone,
  • lavoro effettuato da persone,
  • meccanismi semplici o complessi,
In particolare, abbiamo la necessità di individuare casi significativi con impatto concreto sul sistema, e quindi:
  • disegnare le due "astrazionie" di flussi reali, ossia due modelli di lavoro reale.
  • descrivere tali flussi con i costrutti offerti da JPDL+BPEL, vincolando tali flussi a condizioni di controllo, tipo la condizione ACID (Atomica, Consistente, Isolata, Duratura) così da garantirne sequenzialità, ripetibilità, coerenza e affidabilità.

Alcuni esempi di cui si puo' ragionevolmente ipotizzare una realizzazione progettuale di interesse e con un certo impatto sulla struttura del CNR, sono i seguenti flussi:

  1. Esempio: Disegnare il flusso informativo e di lavoro relativo alla propagazione degli eventi all'interno del CNR, dovuto alla presa in forze di nuovo personale attraverso una procedura comparativa oppure una procedura d'urgenza, se applicabile.
  2. Esempio: Disegnare il flusso informativo e di lavoro relativo alla propagazione degli eventi all'interno del CNR dovuto alla cessazione di un rapporto di lavoro per fine naturale dello stesso o per risoluzione anticipata da parte di uno dei due contraenti.
  3. Esempio: Disegnare il flusso informativoT
  4. relativo alla propagazione degli eventi all'interno del CNR, quando una sotto-organizzazione viene eliminata, sostituita, creata, riorganizzata. Tale flusso ha un impatto elevato sul corpus documentale era in possesso della sotto-organizzazione.
  5. Esempio: Disegnare il flusso informativo relativo alla propagazione degli eventi all'interno del CNR, quando si vuole gestire la trasmissione di dati sensibili via portale web, di coloro che hanno rapporti di lavoro all'interno del CNR. In particolar modo con riferimento ai dipendenti, e all'accesso al servizio on-line dell'amministrazione del CNR.
  6. Esempio: Disegnare il flusso informativo relativo alla propagazione degli eventi all'interno del CNR, quando si vuole automatizzare la composizione di report attraverso l'estrazione di dati da varie fonti.
Nel ragionare sui precedenti esempi, diventa evidente come in tale contesto sia necessario disegnare il sistema informativo sulla base del modello del CNR (organigramma) organizzato con


  • risorse,
  • ruoli definiti,
  • masse critiche,
  • misure di efficienza,
  • flussi evidenti.
In maniera trasversale o complementare bisogna individuare:
  • dipartimenti,
  • funzioni,
  • team,
  • progetti,
  • politiche e
  • gerarchie.

Questo comporterà individuare le relazioni rilevanti in tale sistema informativo, per ciascuno dei due specifici flussi. In particolare, ci focalizzaremo sulla sperimentazione di opportuni processi attraverso BPM (Bussiness Process Management). Disegneremo i flussi attraverso uno strumento ormai consolidato e noto con il nome di page flow, che reppresenta i flussi informativi sotto forma di grafi ciclici. Inoltre, disegneremo i processi attraverso BPEL, uno specifico linguaggio nato per la definizione operativa dei processi di bussiness. Per tale scopo, useremo alcune componenti integrate di Alfresco che mette a disposizione il motore jBPM, per il processamento e l'interazione dei workflow, modellati con BPEL e jPDL.

Per entrambi i successivi casi di studio, l'obiettivo è di individuare le procedure concrete che li descrive, le attività che le compongono, le transizioni che consentono di passare da una attività all'altra, i rami concorrenti delle procedure, e tutti i ruoli presenti e necessari. Inoltre, vogliamo individuiamo i "Production Data", che sono tutti i contenuti informativi che esistono indipendentemente dal workflow e che saranno oggetto di trasferimento nel flusso stesso.

Caso di Studio: Accesso ai servizi on-line dell'amministrazione Centrale del CNR

Le principali attività relative al flusso di gestione per la richiesta del PUK necessario per l'accesso ai servizi on-line, sono:


  • Il dipendente, che vuole usufruire del servizi on-line dell'amministrazione del CNR, attraverso il portale (siper,utente) ufficiale, compila un form dichiarando le proprie generalità e fornendo tutte le informazioni richieste nel modulo.
  • Il portale trasforma il form in un documento formato pdf, qundi il documento viene proposto al dipendente per il download.
  • Il dipendente prende visione e accetta, le condizioni di fornitura del servizio in oggetto, autografando il documento. Con tale documento il dipendente dichiara dichiara di accettare le condizioni e le modalità di erogazione e gestione del servizio. Inoltre dichiara di accettare le modalità con cui il CNR tratterà i dati sensibili relativi alle dichiarazioni da lui autocertificate attraverso il portale stesso.
  • Tale documento viene inviato al fax centrale del CNR. Il dipendente allega al fax anche una copia di un documento valido per il riconoscimento. Alternativamente, si potrebbe decidere di consentire la spedizione anche via email (allegando il pdf), o attraverso la consegna manuale del documento cartaceo.
  • Il documento viene catalogato, da un addetto, manualmente in un apposito fascicolo per la richiesta del PUK. L'incaricato sarà incaricato anche di scartare quei fax evidentemente non validi. La non validita del fax riguarda quei fax la cui leggibilità e/o completezza delle informazioni siano non idonee (es.: fax vuoti e fax contenti materiale non idoneo).
  • Tale richieste PUK vengono consegnate manualmente al referente del personale.
  • Le richieste PUK vengono quindi Controllate e Filtrate in base alla correttezza dei dati inviati. Tale controllo viene effettuato sui dati contenuti nel fax. Si ravvisa necessario effettuare un controllo, ad esempio, sulla attendibilità delle firme autografe.
  • Le richieste PUK vengono consegnate all'ufficio protocollo. Il documento sarà quindi gestito e protocollato. Altrimenti, se non protocollabile, sarà scartato e verrà comunicato al referente del personale. Gli elementi che configurano la protocollabilità o meno di un documento sono sotto la responsabilità dell'incarito dell'ufficio medesimo.
  • Le richieste PUK con associato il numero di protocollo vengono consegnate agli uffici predisposti per l'Abilitazione ai servizi on-line e per la Creazione del PUK.
  • Il PUK viene notificato al dipendente.
  • L'abilitazione ai servizi on-line, una volta attivata, viene notificata al dipendente.
  • Le richieste di PUK protocollate, vengono “stoccate”, ossia introdotte in un apposito “repository” attraverso un sistema di “document management e workflow”, dal referente del personale.
  • Le richieste PUK stoccate vengono quindi indicizzate, ed elaborate con OCR.
  • Il flusso termina. Altre condizioni di termine del flusso sono altresi descritte nei sottoprocessi.
Di seguito viene descritto il flusso in modalità visuale:
[[Image:]]
Di seguito descriviamo, in maniera sommaria, i workflow relativi ai sotto processi che riguardano:
  • Il flusso in cui l'addetto al controllo e filtraggio, rileva elementi di non validità e quindi trasmette, se possibile, notifica di ciò al dipendente.
  • Il flusso in cui il protocollo, rileva elementi di non protocollabilità e quindi notifica all'addetto al controllo del fax.
  • Il flusso in cui l'ufficio per la creazione del PUK, rileva elementi di errore nei dati (es.: Nominativo inesistente), e notifica al dipendente.
  • Il flusso in cui l'ufficio per l'abilitazione ai srvizi, rileva elementi di errore nei dati (es.: Nominativo inesistente), e notifica al dipendente.
  • Il flusso di Classificazione e Indicizzazione del documento, con trasformazione in OCR del documento stesso.
[[Image:]]


Caso di Studio: Gestione Richiesta Report

Le principali attività della procedura di gestione del trattamento delle auto dichiarazioni in materia di norme fiscali e previdenziali, sono l'arrivo di un documento già formato con il quale un soggetto dichiara di aver determinati requisiti per accedere a benefici fiscali e previdenziali. Tale documento potrà arrivare sotto forma di fax, email, o documento cartaceo scannerizzato. Il documento viene di seguito introdotto nel repository scelto. A questo punto il documento viene classificato ed è pronto per lo smistamento. Viene quindi inserito in opportune code di consegna. Ultima attività presente nel flusso è l'associazione dei benefici fiscali e previdenziali al dipendente della dichiarazione.

Le principali transizioni che mettono in relazione le attività su descritte sono l'arrivo del documento già formato, stoccaggio, classificazione, smistamento, validazione requisiti e benefici.

I rami concorrenti che, contribuiscono allo svolgimento del flusso, rappresentano, in questo caso le sole attività indipendenti, che possono essere eseguite in modalità parallela. Nel caso specifico, l'unica forma di indipendenza la si rileva tra alcuni possibili "steackholders" che debbono prendere visione del documento. Invece, non si evidenziano punti di sincronizzazione, ossia non sono noti stati in cui il flusso converge.

Per quanto riguarda i ruoli che integrano il flusso, individuiamo pochi ruoli corrispondenti a risorse umane. Qualora il documento non arrivi attraverso un fax, ma bensi attraverso una copia cartacea, un ruolo risorsa umana avrà il compito di dematerializzare il documento attraverso lo scanner. Quando è avvenuta la transizione che porta il documento nello stato di classificato, si individua la necessità di una convalida umana di corretta classificazione. Tale risorsa a campione si occuperà di validare alcuni documenti classificati. Inoltre, la presa visione del documento e la profilazione dell'utente dipendente del documento prevede una risorsa umana per ciascuna attività. Altri ruoli, che non sono risorse umane, sono un fax server, ed uno scanner, attraverso i quali i documenti vengono immessi nel flusso.

Il modello di flusso si compone di pattern "Sequence" e di "Parallel Split". Successivamente potrebbe essere raffinato.


Selezione del Flusso Informativo

Alfresco e' un sistema a componenti di gestione documentale e molto altro. Una delle componenti piu' versatili e' il motore di ricerca integrato noto come Lucene. Le tecniche applicate da Lucene appartengono al mondo dell' Information Retrieval. L'idea e' di selezionare i flussi informativi attraverso tale motore.


Gestione Documentale

Nell'ambito del sistema informativo del CNR, in generale il contenuto informativo viene raccolto in documenti. I corpus che ne derivano solitamente hanno numeri elevati di documenti, con trend di crescita decisamente veloci.  Spesso i contenuti  informativi sono sia di natura legale che amministrativa, che ha spesso la necessità di essere consultata e altrettanto spesso e' difficile cercare informazioni specifiche in documenti autorevoli considerando la vastità di informazione contenuta. Per questo motivo vogliamo applicare alcune tecniche, di cui la piattaforma Alfresco dispone o può potenzialmente disporre, per:


  • rappresentare,
  • sintetizzare,
  • comprimere,
  • pesare,
  • catalogare ed ordinare 

tali corpus sulla base del loro contenuto e del contenuto di specifiche interrogazioni.

Vogliamo analizzare e trovare soluzioni efficaci per quello che riteniamo un aspetto strategico di quasi tutte le realtà produttive, ossia l'uso efficace dei contenuti dei “documenti informatici o informatizzati”. La letteratura mostra come tale diffusione ha indotto una trasformazione radicale nella produzione e gestione dell'informazione e della relativa documentazione che porta con se il contenuto di tale informazione. L'informazione, vista sotto vari punti di vista rappresenta la conoscenza, il cui trasferimento deve poter avvenire all'interno di una qualunque comunità, nel modo più efficace.

Alfresco ci permette di utilizzare modelli, procedure, e algoritmi per il trattamento di tali corpus in cui è presente una elevata quantità di informazione nascosta dalla vastità degli stessi corpus. E percheè no, ci permette di sfruttare i motori di processamento dei workflow per rendere la gestione documentale parte integrante dei flussi informativi. Per ora abbiamo valutato il motore di ricerca LUCENE, le cui funzionalità offerte, di classificazione dei documenti, e valutazione delle interrogazioni, sono integrate in Alfresco. Ma stiamo anche valutando altre implementazioni da integrare in sostituzione o in maniera complementare, tipo Terrier.  Stiamo analizzando alcuni risultati scientifici derivanti dalle tecniche di "Information Retrieval".

L'importanza del documentale si puo' facilmente vedere quando si prendono in considerazione documenti di natura legale, amministrativa o pareri esperti. Qui i documenti rilevanti, per un certo argomento, di per se non indicano l'autorevolezza del documento rispetto alla ricerca. Il modello di interrogazione e ricerca deve essere capace di esprimere la rilevanza di un documento rispetto ad altri fattori, come ad esempio l'opinione espressa in esso. L'autorevolezza e quindi la rilevanza di un documento rispetto ad una specifica interrogazione è data ad esempio dall'opinione, se presente, espressa da esperti di un particolare settore o da chi ne e' il rappresentante legale.

L'obbiettivo è quindi di sperimentare la gestione documentale in particolari ambiti del sistema informativo, ad esempio basandoci sui numerosi problemi relativi al corpus derivante dalla protocollazione.