Archive gibt es schon seit der Antike und entsprechend groß ist der Erfahrungsschatz, den Bibliothekare und Archivare dabei zusammengetragen haben. Doch lassen sich diese Erfahrungen überhaupt für digitale Archive nutzen? Ein Archiv heute definiert sich grundsätzlich als Ablageort für im Tagesgeschäft nicht mehr benötigte Daten. Es ist deshalb kein Backup, das Produktionsdaten in einer Sicherungskopie vorhält, sondern immer eine Datenmigration. Vom teueren Online-Storage werden abgeschlossene Produktionen ins Archiv bewegt und am Ursprungsort gelöscht. Archivieren schafft Platz und spart damit beim teuersten Speicher. Später dazu mehr.
Bei näherer Betrachtung unterstützt oder ermöglicht ein systematisches Archiv erst eine Vielzahl von Prozessen in einer Firma:
• Konsistente Nachvollziehbarkeit der Produktion
• Recherche, Referenz und Zweitverwertung von Produktionen und Medien
• Katastrophenvorsorge durch Langzeitarchivierung mit Auslagerung
• Erfüllung gesetzlicher Auflagen
• Schutz vor juristischen Angriffen
• „Gedächtnis“ der Firma
Damit bietet die Einrichtung eines Archives auch die Möglichkeit Prozesse und Arbeitsabläufe in einer Firma klarer zu fassen und auf eine rationale Basis zu stellen. Frühzeitig sollten alle direkt und indirekt Beteiligten an einen Tisch geholt werden, um sie an der Planung zu beteiligen. Gerade auch bei kleinen und mittelgroßen Firmen kann hier Transparenz geschaffen werden, die letztlich allen zugute kommt. Die spätere Rollenverteilung bietet eine wichtige Planungshilfe: Wer archiviert und wohin? Welches Material? Wer entscheidet wann? Wer sucht später und nach was? Wer restored und wohin? Wer ist verantwortlich für die Langzeit-Planung, Migrationen, Überprüfung von Archiv und Medien? etcetera.
Das Ausformulieren von Use Cases, das heißt, wie soll die tatsächliche Nutzung später Schritt für Schritt ablaufen, bringt nötige Überlegungen zum Vorgehen, zur Workflow-Integration und zu Verantwortlichkeiten an den Tag. (1)
Individuelle Anforderungen gilt es dabei zu berücksichtigen, jedoch gleichzeitig Vorerfahrungen und allgemeine Archivierungserkenntnisse anzuerkennen und zu nutzen. Das ermöglicht die Nutzung von Bewährtem und sorgt für eine kosteneffiziente Lösung und Implementierung.
Archivgröße
Die Größe des Archivs, sowie die Professionalität seiner Umsetzung stehen ganz am Anfang der Planung. Das Spektrum beginnt bei einer händisch zu bedienenden Einzellaufwerkslösung und geht über verschiedene Größenstufen automatisierter Lösungen bis hin zur Unternehmenslösung. Drei Archivgrößen-Kategorien lassen sich hier definieren:
• klein: bis 50TB und geringe Nutzungsfrequenz und nur ein „Archivar“;
• mittel: bis etwa 300TB mit mehreren Nutzern;
• groß: ab mehrere hundert TB.
Die kleinste Lösung bietet an einem Archivarbeitsplatz die Möglichkeit nach dem bekannten Schema „eine Produktion = ein Tape“ weiterhin zu archivieren, allerdings bei Nutzung aller Vorteile eines Digitalarchivs, das heißt verschlagwortung, suchen und blättern im Archivkatalog, höchste Datensicherheit durch LTO-Tapes. Das Einlegen von LTO-Tapes zum Archivieren oder zum Restore erfolgt manuell.
Bei mittleren und großen Archiven ist die Verwendung eines Tape-Roboters, das heißt einer Tape-Library unumgänglich. Im Zusammenspiel mit der Archivsoftware wird hier das benötigte Tape automatisch eingelegt, bei Bedarf ein leeres Tape verwendet und auch für den Restore das nötige Medium bereitgehalten. Es ist wichtig zu wissen, dass die kleinsten Automationslösungen bereits etwa beim Preis eines Einzellaufwerks beginnen. Dafür bekommt man acht Tape-Slots, die bei LTO-5 bei zu 12TB Kapazität bedeuten.
Archivwachstum und Skalierbarkeit
Sowohl Hardware wie auch Software sollten dem heutzutage kaum vorhersehbaren Wachstum der Firma entsprechen können. Beim Kauf einer Tape-Library kann diese bereits einbezogen werden, wie das Modell T40+ von Tandberg Data eindrucksvoll belegt. Hier können bei Bedarf auf die Basiseinheit mit bis zu 40 Tape Slots ein oder bis zu vier weitere „leere“ Einheiten zu einem Turm aufgebaut werden, die alle durch einen zentralen Transportslot verbunden sind. Alle Einheiten nutzen so die in der Basiseinheit eingebauten Laufwerke und der Transportmechanismus bringt Tapes aller „Stockwerke“ dorthin. Damit lässt sich eine Kapazitätserweiterung jederzeit mit überschaubarem finanziellen und technischen Aufwand realisieren. Softwareseitig sollte eine Lösung in der Lage sein sowohl Einzellaufwerke wie auch Tape-Libraries aller Hersteller zu unterstützen. Eine Lizenzierung nach Funktion und Slots ist der nach geschriebenen Tapes vorzuziehen. PresSTORE P4 von Archiware ist beispielsweise eine Lösung, die diese Anforderung erfüllt und durch ihr Browser-Interface zusätzlich extrem einfach zu bedienen ist. (1a)
Es mag anachronistisch erscheinen, dass nach der Einführung von Tapeless-Workflows nun ausgerechnet wieder auf Tape gesichert werden soll. Doch genau das ist der Stand der Technik und LTO-Daten-Tape unterscheidet sich ganz wesentlich von allen Video-Tapes. Zudem ist ein Medienübergang zur Erfüllung von professionellen Sicherheitsanforderungen seit langem bewährt, um nicht alle Daten den gleichen durch die jeweilige Technologie bedingten Risiken auszusetzen. Festplatten sind, das gerät immer wieder aus dem Blickfeld, letztlich Verschleißteile. Eine längere Lagerung von Festplatten ist mit erheblichen Risiken behaftet, da diese dafür nicht ausgelegt sind und oft nach einem Jahr Lagerung schon nicht mehr anspringen. Zusätzlich steigt die Menge der verlorenen Daten beim Ausfall einer Platte ständig an, da sich die Datendichte immer weiter erhöht. Verlor man im Schadensfall mit einer Platte noch vor wenigen Jahren 500GB, so sind es heute schon 2TB, also viermal soviel.
Tape hingegen ist spezifisch für lange Lagerung konzipiert und zudem unauffällig für Malware, Viren, Bedienerfehler, etcetera, solange es sich nicht in einem Laufwerk befindet. Einzige professionelle Bandtechnologie, die vom LTO-Konsortium (aus IBM, HP und Quantum) weiterentwickelt und lizensiert wird.
Der Zeithorizont, der hier angesprochenen Archivierung beträgt ganze Jahrzehnte. Wer kulturhistorische Schätze für die Nachwelt und damit für 100 Jahre und mehr archivieren muss oder möchte, muss derzeit noch auf Film zurückgreifen. Spezialpublikationen im Anhang weisen den Weg dazu. (2)
Media Asset Management – MAM und Archiv
Die Verwaltung, Freigabe und Organisation von Mediendaten erledigen heute in vielen Firmen MAM-Systeme. Seit sich Apple aus diesem Feld durch die Abkündigung von Final Cut Server verabschiedet hat, ist CatDV von Squarebox eine der wenigen Alternativen, die ohne sechsstellige Investition auskommen. Befindet sich ein MAM im Einsatz-Order oder soll es angeschafft werden, dann ist es sinnvoll, nach der Integration des Archivs in dieses System zu fragen, da die meisten MAM-Systeme selbst keine Archivfunktion besitzen. Für das angesprochene CatDV beispielsweise existieren Integrationen mit P4-Archiven wie auch mit anderen Systemen. Damit kann innerhalb der MAM-Software direkt archiviert werden, ohne das Programm zu verlassen.
Formate und Codecs
Sicherlich ist es sinnvoll sich Gedanken zu machen in welchem Format archiviert werden soll. Für die meisten heutigen Produktionsgegebenheiten wird es genügen, die Projekte als Ganzes inklusive des Quellenmaterials und zusätzlicher relevanter Dateien zu archivieren sowie möglicherweise einem gerenderten Clip der Endfassung, wie er zum Beispiel auch für mobile Plattformen abgegeben werden muss. Schließlich gilt es, das archivierte Projekt, wenn nötig, zügig wieder in den eigenen Arbeitsablauf zu integrieren. Überlegungen zur Langzeitperspektive und Herstellerunabhängigkeit haben zum offenen MXF-Format geführt und zeigen auch die Kehrseite der Herstellerunabhängigkeit. Kein derzeitiges Betriebssystem kann MXF-Dateien von selbst abspielen. Dazu sind Dritthersteller-Lösungen nötig wie beispielsweise MXF4mac von HamburgProMedia, das MXF Unterstützung elegant für OS und Anwendungen bringt. Einsatzgebiete sind heute hauptsächlich Sender, die für Jahrzehnte im Voraus planen müssen und sich daher oft für diesen offenen Standard entscheiden.
Der Schlüssel zum Archiv: Metadaten
Entscheidend dafür, was in einem Archiv nach Jahren gefunden werden kann, sind die Beschreibungs- oder Metadaten. Hier wird formuliert, was nicht aus dem Dateinamen und Format ersichtlich ist. Das Spektrum reicht von technischen Metadaten wie verwendete Kamera und deren Einstellungen bis zu den Namen der an einer Produktion beteiligten Personen. Zusätzlich kann noch Beschreibung des Inhaltes, Verwaltungskategorien und anderes relevant sein. Da diese Metadaten von nicht zu überschätzender Bedeutung für die spätere Funktion, also das Wiederfinden, sind, müssen sie in der Planung genug Raum bekommen. Auf Erkenntnis anderer zurückzugreifen ist gerade hier von besonderer Bedeutung (siehe Anhang). Ein entscheidendes Kriterium ist die Konsistenz mit der Metadaten erfasst und eingetragen werden. Nur ein dauerhaft Verantwortlicher kann hier entscheiden, was wie zu formulieren ist. Auch die Einhaltung dieser einmal festgelegten Regeln muss er überwachen. Technik kann hier nur die Informationen aufnehmen. Die Entscheidungen und Abläufe sind organisatorischer Natur und bedürfen sorgfältiger Beachtung. (3)
Was gehört ins Archiv?
Sicherlich gibt es zahlreiche individuelle Anforderungen zur Frage, was archiviert wird. Dennoch gilt es allgemein die Daten zusammenzustellen, die logisch zusammengehören, das heißt alle Projektdaten inklusive Office-Dateien, Plänen, Entwürfe und zusätzlichen Grafiken, etcetera. Egal wie diese Informationen für die Produktion und Planung gruppiert waren, gehören sie nach Abschluss eines Projektes zusammen, damit später eine Produktion nachvollzogen werden kann.
Neben den digitalen Medien gibt es in Firmen noch reichlich andere Daten sowie auch noch Dokumente auf Papier. Da diese Daten großteils einer gesetzlichen Aufbewahrungspflicht unterliegen, liegt der Gedanke nahe sie ebenfalls digital zu archivieren. Möglich ist eine Kombination des Medien-Archivs mit dem Dokumentenmanagement. Dabei werden alle eingehenden Dokumente gescannt und mit einer Texterkennung (OCR = Optical Character Recognition) bearbeitet. Anschließend werden sie direkt in einen Dokumentenpool überführt. Sichtung, Bearbeitung und Zuordnung erfolgen dann ausschließlich mit dem digitalen Dokument. Was sich nach einer großtechnischen Lösung anhört findet tatsächlich in vielen kleineren Firmen bereits statt und ist dort sogar leichter zu realisieren. Das Versprechen des papierlosen Büros kann damit erstmals wahrnehmbar realisier werden. (4)
Eine Minimallösung für Firmendaten besteht in der Archivierung auf WORM-Medien. LTO-WORM Tapes lassen sich nur einmal beschreiben, was auch in mehreren Sessions geschehen kann. Geschriebene Daten sind unveränderter, den gesetzlichen Vorgaben entsprechend und außerdem mit allen nötigen Zertifizierungen dafür ausgestattet. Eine mehrmals im Jahr erfolgende Archivierung der Geschäftsdaten und Korrespondenz ist technisch und finanziell die einfachste Einstiegslösung, um die gesetzlichen Vorgaben zu erfüllen und zusätzlich Sicherheit zu schaffen. Dazu sollten diese Medien dann außerhalb des Büros gelagert werden, um sie vor lokalen Schädigungen zu schützen. (5)
Archiv und Backup
Wie erwähnt ist das Archiv kein Backup, da es nicht mehr benötigte Dateien langfristig aufnimmt, die anschließend von der Quelle gelöscht werden. Damit würden sie nur noch ein einziges Mal vorliegen, was einem professionellen Sicherungsanspruch nicht genügen kann. Deshalb gibt es Softwarelösungen (unter anderem P4 Archive), die Cloning-Funktionen bieten. Sie erlauben es, zwei identische Tapes beim Archivvorgang zu erzeugen. Eines davon wird anschließend ausgelagert, um maximale Sicherheit zu erreichen gegen Medienausfall und auch lokale Schäden in der Firma. In diesem Zusammenhang sei auch auf die sinnvollerweise anzustrebende Kombination von Backup und Archiv hingewiesen. Eine regelmäßige Sicherung auf Tape von Server-Daten, die dann ebenfalls ausgelagert werden können, gehört in jedem Fall zu einer zeitgemäßen professionellen Sicherungsstrategie. Für den schnellen Zugriff im Normalfall kann diese mit einer Sicherung auf Disk kombiniert werden. So werden maximaler Komfort und Zugriffsgeschwindigkeit vereint mit dem professionellen Sicherheitsniveau der Medienauslagerung.
Ein oft übersehener Aspekt der Archivierung auf LTO-Tape ist, dass die tatsächlichen Kosten über längere Zeit durch Einsparung mehr als abgedeckt werden. Ein Archiv amortisiert sich bereits nach einzelnen Jahren. Eine neue Studie zeigt sogar, dass bei einem Betrachtungszeitraum von zwölf Jahren die Energiekosten der Speicherung auf Disk allein die Gesamtkosten des Archivs übertreffen.(6)
Die Einsparung des teueren und hoch-performanten Diskspeichers durch Migration der Daten ins Archiv bedeutet mehr Speicher für aktuelle Projekte, weniger Erweiterungsdruck und gesteigerte Quality-of-Service für die Nutzer. Tape benötigt circa 90 Prozent weniger Strom als RAIDs und produziert dementsprechend weniger Wärme, die abgeführt werden muss. Zusätzlicher Gewinn entsteht durch die gesteigerte Sicherheit des Mediums und der leichten Auslagerung von Tapes sowie durch die gesteigerte Transparenz und Auffindbarkeit von abgeschlossenen Produktionen. Für Dienstleister in der Produktionskette kann die durchgängige Archivierung aller Daten ihrer Auftraggeber ein zusätzlicher Service sein, der die Bindung des Auftraggebers erhöht, weil ihre früheren Daten jetzt endlich zuverlässig und einheitlich beim Dienstleister aufzufinden sind.
Benefits
Ein gut geplantes digitales Archiv bringt vielfachen Gewinn. Von der konsistenten Auffindbarkeit aller Projekte über professionelle Datensicherheit durch Auslagerung bis zur tatsächlichen finanziellen Amortisation ist jedes für sich genommen schon Grund genug zu beginnen. Stetig wachsende Datenmengen erhöhen die Dringlichkeit noch weiter. Es lohnt sich, Zeit und Ideen in die Planung zu investieren sowie in professionelle Hard- und Software. Die Sicherheit und Konsistenz eines Archivs kann zudem alle Mitarbeiter und Prozesse positiv beeinflussen. Fließen alle Produktionen in ein Archiv als „Firmengedächtnis“, so entsteht damit eine Sichtbarkeit und zusätzliche Motivation. Schnelle Recherche, Überblick und Zweitverwertung tragen ihren Teil dazu bei. Kurzum, wer professionell produziert sollte auch professionell archivieren.
Dr. Marc M. Batschkus
(MB 12/11_01/2012)
Vielfacher Gewinn
Beim Umstieg auf filebasierte Workflows im Rundfunk und in der Medienproduktion sind die Einrichtung und der Betrieb eines sicher und zuverlässig funktionierenden, digitalen Archivs von zentraler Bedeutung. Bei der Konzeption fallen viele Fragen an. Welche Grundvoraussetzungen muss es erfüllen? Welche Weichen sind zu stellen und welche Entscheidungen zu treffen, um zu einer passgenauen, zukunftsorientierten Archivinstallation zu gelangen? Archiv-Experte Dr. Marc M. Batschkus skizziert für MEDIEN BULLETIN die wichtigsten Faktoren.