Oppgradert EMC VFCache med inline deduplisering og vMotion støtte

I forbindelse med VMworld 2012 lanserer EMC en oppgradering til sin VFCache teknologi – Versjon 1.5.
I tillegg til dagens 300GB SLC kort er også 700GB SLC nå tilgjengelig. Kunder som har VFCache versjon 1.0 får kostnadsfri oppgradering til 1.5.

VFCache ytelsen er over 700.000 IOPS!
(4k random read)

EMC VFCache 1.5 støtter nå rask inline deduplisering med 8k blokkstørrelse,  bransjens første i skrivende stund.
Med inline deduplisering gjør kortet datareduksjonen i fart. Denne egenskapen kan man slå av og på for hele kortet.
Man sparer ikke bare plass med deduplisering, levetiden på flash cellene blir også forlenget siden data ikke skrives like ofte til kortet.

EMC VFCache er et hurtigbuffer ute på serveren.  Data som leses ofte hentes direkte fra dette kortet istedet for å gå veien om nettverket til lagringsystemet.
Bildene under illustrerer et VNX lagringsystem der to volumer har veldig høy belastning. Ved å bruke VFCache vil man flytte mesteparten av denne trafikken ut til serveren og samtidig avlaste lagringsystemet.
Les videre

Tiering og caching – Passer det for alle ?

Nei, det passer ikke for alle.
Selv om autotiering og flash basert caching gir svært gode resultater i mange tilfeller, så er det også områder der det ikke passer så godt.

Generalisering er litt farlig, men jeg vil likevel dele noen av mine erfaringer og gi noen generelle råd.  La dette være et utgangspunkt for en videre diskusjon, og ikke noe som skrevet i stein!
Les videre

EMC VFCache – Turbo for databaser

Jeg har beskrevet autotiering internt i lagringsystemer tidligere.
Nå skal vi se nærmere på hvordan man kan få bedre databaseytelse ved å mellomlagre data ute på serveren.

Moores lov har definitivt gjort seg gjeldende de siste tiårene.  Ytelsen er mangedoblet på standard x86 servere.
Det samme kan man ikke si om lagring, hvor mekaniske harddisker har vært den rådende teknologien. Men dette endret seg med flashdisker som gjorde sitt inntog for 5 år siden.

Med flashdisk i lagringsystemet kan man oppnå veldig høy ytelse uten å måtte ty til mange mekaniske disker parallel.
Men data må fortsatt transporteres over nettverket for å kunne brukes av applikasjoner ute på serveren.

EMC VFCache løser denne utfordringen ved å mellomlagre hyppig brukt informasjon lokalt på serveren, samtidig som det trygt lagres sentralt på EMC VNX/VMAX.
EMC VFCache er et PCIe kort man installerer i serveren og som gir FAST Autotiering helt ut til serveren.   Den teoretiske ytelsen på dette kortet er svært høyt, opp til 750.000 IOPS.  Du kan sammenligne dette med ytelsen fra over 4000 mekaniske disker!  Les videre

Ny generasjon EMC FAST Autotiering

Tenk deg et lagringsystem med 10TB kapasitet i 2001.  Hvis vi så legger til grunn 60% vekst år-over-år,  ender man opp med et behov på 120PB i 2021 !
Analyserer man innholdet nærmere vil man raskt oppdage at mesteparten av dette sjelden eller aldri er i bruk.  En annen observasjon vil være at det er veldig mye like eller tilnærmet like data. Her må man fram med verktøykassen for å rydde opp.  Det er tre verktøy jeg ville brukt:

  • Arkivering: Flytte inaktive data ut av primærlageret til et arkiv (tier 4)
  • Deduplisering: Redusere størrelsen på datavolumer med mange duplikater
  • Autotiering: Legge «varme» data på flashdisker og «kalde» data på rimeligere disker.

Her er det mye å ta tak i,  men la oss starte med den siste av disse – Autotiering

Autotiering handler om økonomi

Før vi graver oss ned i teknikken og nyheter fra EMC World 2012, må vi se litt på økonomien… Les videre

En fremtidsvisjon

Det første innlegget på denne bloggen blir en fremtidsvisjon. Vi står foran en enorm datavekst i årene som kommer.  IDC har i en undersøkelse sponset av EMC anslått veksten til å være over 50X frem til 2020.   I samme tidsrom vil antall driftspersoner kun øke med 1.5X.   Ny teknologi vil selvfølgelig muligjøre noe av dette,  men det krever også at vi må tenke anderledes for å kunne håndtere denne veksten. Tradisjonelle metoder skalerer ikke.
De store datamengdene representerer også enorme verdier for selskapene som eier dem. Et begrep som «Big Data» brukes ofte om løsninger som skal håndtere, analysere og tilgjengeliggjøre veldig store mengder data.

Fremtidens lagringsystemer må ivareta behovet for skalerbarhet i kapasitet og ytelse,
uten av kostnadene øker i samme takt som datamengden.  Et kjempestort kinderegg med andre ord!

Jeg velger å starte med ytelse, og hvordan man kan løse disse utfordringene. Les videre