Fortsatt trend av prospekteringsdata: Tableau stänger portfölj luckor, förvärvar hyper

Godan, mata världen med öppna uppgifter

DataRobot syftar till att automatisera lågt hängande frukt uppgifter vetenskap

Ansluten behöver moln era bättre nätverk

Facebook öppna källor ZStandard datakomprimering algoritm, syftar till att ersätta tekniken bakom Zip

Komplettering strukturerad fråge och analys med on demand prospekteringsdata. utforskning uppgifter stöder on demand datamodeller eller lös koppling av data och metadata (aka sen bindning, schema på läsning). En analytiker kan bygga modellen från en rå datauppsättning och analysera den på samma gång. Inget behov av att vänta på en DBA för att skapa den modellen.

Att dra nytta av in-memory prospekteringsdata. BI-verktyg baserade på in-minnesdata arkitektur såsom Microsoft PowerPivot / PowerViewer, Qlik (QlikView och QlikSense produkter), Tableau Software, TIBCO Spotfire är i grunden kalkylark på steroider. Så länge du har en datauppsättning med rader och kolumner, bara ladda det i minnet och börja utforska. En prospekteringsanvändningsfall kan helt enkelt söka efter data (inte något som SQL-databaser enkelt stödja). Och när du hittat vad du letar efter, bara tagga datakolumner som åtgärder eller attribut, skapa virtuella on demand kuber eller pivottabeller. Därefter kan användaren gå in analys – skiva och tärnings – läge. Detta är en av de främsta orsakerna bakom tablån förvärv av hyper. Andra leverantörer inom loppet, särskilt Qlik och TIBCO Spotfire, hade en fördel över Tableau ha uppfunnit och fulländat i minnet arkitektur år tidigare. Ja, ett par år sedan tablån gjorde släppa en in-minnesdata blandning funktion men det var huvudsakligen baserad på platta i minnet tabeller och var inte lika effektiv som konkurrenternas erbjudanden. Nu när gapet är verkligen stängd.

Uppgradera till stora uppgifter NoSQL prospekteringsdata. Men notera! Exemplet ovan fungerar bra på relativt små datamängder (vanligtvis inom en terabyte). För data prospektering på stora datamängder som inte passar in i minnet – flera terabyte och mer – BI proffsen kommer att behöva leta någon annanstans genom att uppgradera till stora datalager som HDFS och / eller NoSQL-databaser. Goda nyheter är att de också har många olika val. Det finns två populära alternativ. En är att utforska data iscensatt i HDFS direkt med hjälp infödda Hadoop BI-plattformar som Datameer, Platfora, TreasureData och Zoomdata. En annan – som fungerar bäst när du behöver utforska data iscensatta över hela företaget – inte bara i HDFS utan även i alla NoSQL och SQL-databaser – är att indexera uppgifterna. Ledande leverantörer inom detta segment Attivio, IBM Watson Explorer och Oracles Big Data Discovery göra data prospektering ännu enklare genom att genomföra en sökning liknande användargränssnitt som gör det möjligt för användare att snabbt upptäcka hög nivå mönster som de sedan kan borra ner till att använda mer traditionella SQL-liknande frågor.

Data Management, Godan, mata världen med öppna data, stora datamängder, DataRobot syftar till att automatisera lågt hängande frukt uppgifter vetenskap, moln, Ansluten behöver moln era bättre nätverk, lagring, Facebook öppna källor ZStandard datakomprimering algoritm, syftar till att ersätta tekniken bakom Zip