Een brug over problematische gegevens: ondernemingen toegang geven tot geavanceerde machine learning

Van banken tot gezondheidszorg, bijna elke organisatie wil geavanceerde AI- en machine learning-gestuurde applicaties implementeren die efficiëntie transformeren en nieuwe diensten en zakelijke kansen creëren

Ze willen intelligentere toepassingen voor belangrijke gebruiksscenario’s, zoals realtime fraudevoorspelling, een betere klantervaring of snellere, nauwkeurigere analyse van medische beelden.

Het probleem waarmee de meeste organisaties worden geconfronteerd, is dat ze gegevens opslaan in verschillende vormen en locaties, die elk tot een bedrijfseenheid of afdeling kunnen behoren. Het is veeleisend om deze data bruikbaar te maken voor geavanceerde applicaties.

Vóór de komst van het nieuwe paradigma – de slimme datafabric – zou de benadering zijn geweest om een ​​datameer of magazijn te creëren, met behulp van de relatief lage kosten van opslag en rekenkracht. De organisatie gebruikt dan waarschijnlijk ook tijdrovende ETL-processen om de gegevens te normaliseren.

Het traditionele datameer is traag en wordt steeds moerasachtiger

Deze benadering, die nog steeds wijdverbreid wordt gebruikt, heeft zijn overwinningen behaald, maar creëert een gecentraliseerde opslagplaats waardoor gegevens moeilijk te analyseren zijn en vaak geen consistente of snelle antwoorden op zakelijke vragen biedt. Het heeft de neiging om de gegevens naar de query te brengen in plaats van de query naar de gegevens, waardoor latentie ontstaat en vaak aanzienlijke en onnodige duplicatie wordt veroorzaakt.

Dit maakt het erg moeilijk om nieuwe gegevensbronnen te accommoderen als reactie op veranderende zakelijke vereisten, wat de organisatorische wendbaarheid ondermijnt. Het is ook niet in staat om te voldoen aan de huidige vraag naar schone data die geschikt is voor nieuwe samengestelde applicaties die AI-enabled zijn en machine learning (ML) gebruiken en integreren met enorme, reeds bestaande datasets.

In werkelijkheid hebben bijna alle organisaties nog steeds moeite om een ​​consistent, nauwkeurig, realtime beeld van hun gegevens te bieden. De overgrote meerderheid bewaart gegevens nog steeds in afzonderlijke silo’s, met misschien slechts vijf procent die gegevens kan gebruiken die minder dan een uur oud zijn. Dat zal bijvoorbeeld geen significante overgang mogelijk maken van relatief eenvoudige fraudedetectie naar voorspelling, waarmee witwasactiviteiten in enorm complexe financiële stromen kunnen worden geïdentificeerd en gevolgd.

Organisaties nemen te veel beslissingen met behulp van verouderde informatie, overweldigd door de verscheidenheid aan gegevensbronnen en de complexiteit om ze te verenigen. Uit mondiaal onderzoek eerder dit jaar door InterSystems bleek dat bijna elke deelnemende financiële organisatie (98%) data- en applicatiesilo’s heeft en aanzienlijk meer dan een derde (37%) zei dat hun grootste data-uitdaging de tijd is die nodig is om toegang te krijgen tot die data. Zoals zoveel organisaties hebben deze financiële bedrijven het vermogen nodig om in hun complexe, heterogene gegevens te kunnen kijken en snel en consistent antwoord te krijgen op hun zakelijke vragen. Ze hebben een architectuur nodig die is opgebouwd rond wat het bedrijf nodig heeft, in plaats van een enorm en gecompliceerd datawarehouse of meer dat gewoon een starre silo wordt.

Hierdoor kunnen bedrijven de ML-algoritmen gebruiken waarvan ze weten dat ze grote voordelen zullen opleveren. Maar geavanceerde analyses en AI zijn afhankelijk van schone, geharmoniseerde gegevens, wat moeilijk te bereiken is in een repository. Het is de reden waarom het innovatieniveau in ML-modellen momenteel de snelheid en schaal van implementatie overtreft. De afwezigheid van afhankelijke data maakt het onmogelijk om deze modellen in te bedden in de operationele applicaties die ze genereren. Ondertussen groeit het volume en de complexiteit van data voortdurend.

Breng de query naar de gegevens

Gelukkig neemt het smart data fabric-concept de meeste van deze dataproblemen weg en overbrugt het de kloof tussen de data en de applicatie. De fabric richt zich op het creëren van een uniforme benadering van toegang, gegevensbeheer en analyse. Het bouwt een universele semantische laag met behulp van gegevensbeheertechnologieën die gedistribueerde gegevens samenvoegen, ongeacht de locatie, en het achterlaten waar het zich bevindt. Een fintech-organisatie kan een API-gebaseerde orkestratielaag bouwen met behulp van de smart data fabric-benadering, waardoor het bedrijf een enkele referentiebron heeft zonder de noodzaak om systemen te vervangen of gegevens naar een nieuwe, centrale locatie te verplaatsen.

In staat tot analyse tijdens de vlucht, biedt meer geavanceerde technologie voor gegevensbeheer binnen de fabric inzichten in realtime. Het verbindt alle gegevens, inclusief alle informatie die is opgeslagen in databases, magazijnen en meren, en biedt de essentiële en naadloze ondersteuning voor eindgebruikers en applicaties.

Zakelijke teams kunnen dieper in de data duiken met behulp van geavanceerde mogelijkheden zoals business intelligence. De organisatie kan tools inzetten met behulp van machine learning-algoritmen die toepassingen van de volgende generatie mogelijk maken.

Dit is een paradigmaverschuiving, waarbij twee werelden van legacy en nieuwe data samenkomen voor geavanceerde, door ML aangedreven use-cases. Dit is van cruciaal belang, omdat het een enkelvoudig overzicht van gegevens mogelijk maakt over wat een complexe organisatie kan zijn, zoals een financiële instelling met een groot aantal oude silo’s. De technologieën waaruit de fabric bestaat, transformeren en harmoniseren gegevens uit meerdere bronnen op aanvraag, waardoor ze bruikbaar zijn voor uiteenlopende zakelijke toepassingen.

Organisaties hebben de slimme datafabric nodig om bruggen te bouwen tussen al hun vele soorten gegevens op verschillende locaties en bronnen, zodat ze naadloze, realtime toegang krijgen en de volgende generatie AI-aangedreven applicaties kunnen implementeren. Het gaat in feite niet om de technologieën, maar om de uitvoering en hoe de stof zakelijke wendbaarheid dient, ondernemingen toekomstbestendig maakt en omzetverhogende transformatie binnen hun bereik brengt.


Over de auteur

Saurav Gupta is Sales Engineer bij InterSystems. InterSystems is de motor achter ‘s werelds belangrijkste toepassingen in de gezondheidszorg, het bedrijfsleven en de overheid. Alles wat we bouwen is ontworpen om betere beslissingen, acties en resultaten te stimuleren voor de mensen die hun leven en levensonderhoud op onze technologie inzetten. We laten ons leiden door het IRIS-principe: software moet interoperabel, betrouwbaar, intuïtief en schaalbaar zijn.


Leave a Comment