Nächster Schritt:
+43 50705 1110 anrufen
Architektur
Alle System One Lösungen basieren auf einer gemeinsamen technischen Plattform. Diese wird seit 2005 ohne jegliche Altlasten entwickelt, ist gleichzeitig das Ergebnis langjähriger Semantic Web Erfahrung und hat sich in verschiedensten Einsatzszenarien bestens bewährt. Modernen Paradigmen folgend besteht Sie aus unabhängigen Komponenten, die auf einfacher Standard-Hardware horizontal skalieren und mithilfe leichtgewichtiger Web Services verwoben werden.
Komponente:

Adaptoren:
Zur System One Plattform gehören verschiedenste vorgelagerte Adaptoren für strukturierte wie unstrukturierte, externe wie interne Datenquellen. Vorkonfiguriert integriert sind dabei: Diverse Suchmaschinen, Dateisysteme, Mailserver, Wikipedia, globale Nachrichtenquellen und Social Media, Bild- und Videokonsolidierung, JAX, JRDF und JDBC für strukturierte Quellen, diverse proprietäre Inhaltsanbieter wie LexisNexis oder Reed Elsevier, Unternehmenssoftware wie SAP oder Oracle und viele mehr. Außerdem ist ein Crawler Framework enthalten, das Inhalte auf strukturierte Weise aus dem Netz absaugen und über einen graphischen XPath Editor verwaltet werden kann.
 

IO Schnittstelle:
Die zentrale, skriptbare und sichere Datenschnittstelle übernimmt hauptsächliche zwei Aufgaben: Das koordinierte, zeitlich abgestimmte und gesicherte Sammeln aller Daten sowie die Bereitstellung aller Funktionen der Plattform über Web Services. Eingabeseitig verwaltet es periodische Indizierungen wie auch direkte Anbindungen in Echtzeit, überprüft die Datenintegrität und normalisiert die von den Adaptoren bereits bereinigten Daten. Auf der Ausgabeseite wird ein breites Spektrum an Optionen geboten, angefangen von traditionelleren XML SOA Ansätzen (zB JMS, SOAP) bis hin zu sehr leichtgewichtigen Standards (wie zB REST oder JSON). Neben der zentralen Steuerung von allen Sicherheits- und Zugriffsaspekten stellt die IO Schnittstelle auch ein zentrales Monitoring-, Management- und Konfigurations-Interface zur Verfügung.
 

In-Memory Triple 'Blackboard':
Diese Komponente ist eine Erweiterung des ursprünglichen Blackboard Konzepts: Alle eingehenden Meta-Daten werden hier in einem ersten Durchlauf abgelegt. Sobald das passiert ist, werden sie kontinuierlich mittels diverser Algorithmen und Agenten, sowie direktem User Feedback und impliziten Interaktionen erweitert. Ein Beispiel: Die Metadaten eines indizierten Dokuments werden gespeichert, das löst einen Algorithmus aus, der des neue Dokument mit bestehenden verbindet und einen Cluster bildet. In einem nächsten Schritt werden Personen, Kategorien und Orte extrahiert. Anschließend werden alle Interaktions-Logs regelmäßig ausgewertet und daraus Basisdaten für Recommendations abgeleitet und abgelegt. Während das Blackboard dadurch dass es im Speicher liegt extrem performant ist, können die Daten in Triple-Stores, semi-strukturierten Repositories oder sogar klassischen Datenbanken persistiert werden.
 

Backend Indizes:
Während Meta-Daten im Blackboard abgelegt werden, kommen die eigentlichen Inhaltsdaten in einen entsprechenden Index. An dieser Stelle setzen wir auf bewährte Open-Source Technologien wie Lucene (SolR) und können auch bestehende Investments in Enterprise Search Technologien mit einbinden (zB Fast ESP). Ein eigener Index Wrapper sorgt für erweiterte Funktionalitäten wie Federation über größere Node-Gruppen, Normalisierung der Ergebniswerte und anderer Skalierungsfaktoren, welche die Performance massiv erhöhen und Indizes mit mehreren Milliarden Dokumenten ermöglichen. Diese Back-Ends werden nur zum Speichern und Abrufen von Daten verwendet, während ein Großteil der eigentlichen Berechnungen von separaten Algorithmen und Agenten erledigt wird.
 

Algorithmik Framework:
Das Framework, das all unsere Kern-Algorithmen als Komponenten beherbergt ist eine sprachunabhängige Sammlung aus hauptsächlich drei Bereichen des Information Retrieval: Vektor Modelle bzw. Clustering zum Identifizieren von Ähnlichkeiten in und Gruppieren von Inhalten sowie Profilen. Named Entity Recognition zur automatischen Extraktion und Verschlagwortung mit Themen, Eigennamen, Orten, Zitaten etc, wo wir sowohl vollautomatisierte statistische Ansätze, Taxonomie- und Ontologiebasierte Möglichkeiten sowie Mischformen bieten. Der dritte Bereich sind Recommendations, hier werden 'Aufmerksamkeits'-Daten und anderes Nutzerverhalten ausgewertet, um bessere Ergebnisse und höheres Targeting zu erreichen.
 

Front-End Scripting Umgebung:
Ebenfalls inkludiert ist ein vorgelagertes Framework, dass die Entwicklung von Front-End Applikationen sowie Rapid-Prototyping in Java und JavaScript ermöglicht. Aufbauend auf den Helma Object Publisher können die von der Plattform angebotenen Services in finale Anwendungen oder APIs gegossen werden. Egal ob Sie bestehende Anwendungen erweitern oder gänzlich neue entwickeln wollen, Sie finden eine hochintegrierte Umgebung vor, mit der Sie das effizient tun können. Dies gilt natürlich auch für Widgets, mobile Anwendungen und individuelle APIs, und alternativ können Sie natürlich auch weiterhin auf die Entwicklungsumgebung Ihrer Wahl setzen.