Dark Data – den ikke-synlige data, der ligger i dine it systemer
Begrebet ”Dark Data” er data som alle virksomheder har liggende, men som de ikke er vidende om. Til tider kan det være ganske skræmmende at dykke ned i denne datagruppe.
Ifølge IDC er op til 90 % af virksomhedens data ustruktureret data, hvoraf op til 80% er Dark Data.
Forestil dig et scenarie, hvor du skal søge efter dark data på internettet, men der er ikke noget søgeværktøj, websider, tagget eller identificerbart data (ved hjælp af nøgleord eller søgeudtryk) – altså ingen Google, eller andre søgemaskiner til at hjælpe dig med at finde data. Denne type data ligger over alt, men ingen kan finde det, da det er uden en syntaks som virksomheder overvåger i dag.
Dark Data er alt den information, virksomhederne indsamler i deres normale forretningsprocesser, men ikke bruger, eller har planer om at bruge, men omvendt heller aldrig smider ud, og listen er lang. Følgende er nogle af de store syndere af Dark Data produktion:
Applikationer inde i virksomheden
- Weblog-filer
- Sporingsdata for besøgende
- Overvågningsoptagelser
- E-mailkorrespondancer fra tidligere medarbejdere
- Jeres backup
- Mobile enheder
- Automatisering, Marcos RAP, beslutning motor (SQL)
…. og så meget mere
Dark Data kan også være værdifuld data, som aldrig bliver brugt. Det er ikke nødvendigvis nyttigt for alle organisationer, og da det er meget fragmenteret og ustruktureret, da er det kompliceret at gøre brugbart for virksomheder. Men risikoen for svindel er meget stor, hvilket gør det indlysende, at den datagruppe absolut ikke bør ignoreres.

Data flow diagram
- Listen over filer fra en mailboks
- en filtype 0193 som vi beriger med metadata
- viser filens færden genne virksomheden
Selvom databeskyttelse ikke nødvendigvis holder os vågne om natten, så er det en stor opgave for virksomheder, store som små, at sikre sig at de overholder lovgivningen – ca. 90% af deres ustrukturerede data er ikke synlig for nogen. Dark Data bør ikke kun handle om håndtering af lovgivningsmæssige problemer, men som minimum også omhandle det sikkerhedsmæssige.
Denne datagruppe og information kan i sidste ende vise sig meget nyttig at få indsigt i for virksomheder, bestyrelser, ledere, advokater, revisorer og IT. Det kan på få timer skabe et overblik, og den indsigt der skal til for at sikre, skabe muligheder, og give en ide om, hvor de største udfordringer ligger.
I Data Discovery Lab hjælper vi med at automatisere og strømline operationer ved brug af kunstig intelligens (AI). Med evnen til at læse mere end 900 filformater, kaster vi lys over virksomheders Dark Data ved at tilføje struktur til ustruktureret indhold og udarbejde en handlings plan for, hvad der skal til for at disse store mængder af data forbliver synlige – og håndterbare – for jer.
Der er forskel på Dark Data fra virksomhed til virksomhed og branche, men her er et eksempel på, hvad en mellem stor virksomhed har.:
- Antal regneark for 1000 medarbejdere er ca. 2,5 millioner regneark, svarende til milliarder af dataceller
- Mange versioner af det samme dokument, og gamle ansættelses kontrakter og CV’er
- E-mail, vedhæftninger til e-mails
- Filer og .zip-filer, der downloades og derefter ignoreres
- Inaktive databaser og ubrugt kunde information
- Tidligere medarbejderfiler og indhold
- Analytics databaser, regneark for rapporter og undersøgelser
- Logfiler, konto oplysninger og transaktionshistorik
I sidste ende er det data, der er efterladt fra processer spredt over alle niveauer i en virksomhed, der ses bort fra, og betragtes som unødvendigt af én afdeling, men kan være meget værdifuldt for en anden.
Vil du høre mere om, hvordan vi kan hjælpe dig, så kontakt os på info@datadiscoverylab.com eller +45 70 267 800