<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Dans la tête de Doc Malkovich &#187; big data</title>
	<atom:link href="https://blog.developpez.com/jmalkovich/pcategory/big-data/feed" rel="self" type="application/rss+xml" />
	<link>https://blog.developpez.com/jmalkovich</link>
	<description>Réflexions et humeurs sur la Business Intelligence</description>
	<lastBuildDate>Tue, 26 Aug 2014 11:54:41 +0000</lastBuildDate>
	<language>fr-FR</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>https://wordpress.org/?v=4.1.42</generator>
	<item>
		<title>Google : Ne m&#8217;appelez plus Big Data</title>
		<link>https://blog.developpez.com/jmalkovich/p12520/humeurs/google-ne-mappelez-plus-big-data</link>
		<comments>https://blog.developpez.com/jmalkovich/p12520/humeurs/google-ne-mappelez-plus-big-data#comments</comments>
		<pubDate>Tue, 11 Mar 2014 22:40:37 +0000</pubDate>
		<dc:creator><![CDATA[doc malkovich]]></dc:creator>
				<category><![CDATA[big data]]></category>
		<category><![CDATA[humeurs]]></category>

		<guid isPermaLink="false">http://blog.developpez.com/jmalkovich/?p=134</guid>
		<description><![CDATA[Une petite anecdote sur le Big Data &#8230; Avez-vous remarqué que Google évitait d&#8217;utiliser le terme Big Data dans ses communications ? Par exemple sur la page d&#8217;introduction de BigQuery pour les développeurs, aucune allusion au Big Data ! Idem, &#8230; <a href="https://blog.developpez.com/jmalkovich/p12520/humeurs/google-ne-mappelez-plus-big-data">Lire la suite <span class="meta-nav">&#8594;</span></a>]]></description>
				<content:encoded><![CDATA[<p>Une petite anecdote sur le Big Data &#8230;</p>
<p>Avez-vous remarqué que Google évitait d&rsquo;utiliser le terme Big Data dans ses communications ?<br />
Par exemple sur <a href="https://developers.google.com/bigquery/what-is-bigquery" target="_blank">la page d&rsquo;introduction de BigQuery pour les développeurs</a>, aucune allusion au Big Data !<br />
Idem, pas de notion sur le Big Data dans <a href="https://www.google.com/search?as_q=%22big+data%22&amp;as_epq=&amp;as_oq=&amp;as_eq=&amp;as_nlo=&amp;as_nhi=&amp;lr=&amp;cr=&amp;as_qdr=all&amp;as_sitesearch=http%3A%2F%2Fwww.google.com%2Fpress%2F&amp;as_occt=any&amp;safe=images&amp;tbs=&amp;as_filetype=&amp;as_rights=" target="_blank">leurs communiqués de presse</a>.<br />
<span id="more-134"></span><br />
Antonio Regalado l&rsquo;a remarqué. En <a href="http://www.technologyreview.com/view/515941/just-dont-call-it-big-data/" target="_blank">écrivant un article sur le Big Data chez Google</a>, il s&rsquo;est vu opposé à certaines hésitations sur le fait d&rsquo;associer le buzzword à Google.</p>
<p>Pourquoi ? Tout simplement parce que le terme &laquo;&nbsp;Big Data&nbsp;&raquo; est assimilé au &laquo;&nbsp;Big Brother&nbsp;&raquo; du 1984 d&rsquo;Orwell dans l&rsquo;esprit des gens.</p>
<p><img src="http://4.bp.blogspot.com/-_cZdoAr_0ys/TcsT1DyXM3I/AAAAAAAAAN8/qmg1pq1q0HI/s1600/1984web.jpg" alt="big data ou big brother ?" /></p>
<p>Etonnant quand on sait que Google est un des pères fondateurs du Big Data avec l&rsquo;implémentation de MapReduce qui a inspiré Hadoop !</p>
<p>Néanmoins Google ne semble plus si allergique au terme Big Data.<br />
On le trouve dans <a href="https://cloud.google.com/products/bigquery/" target="_blank">les présentations officielles de BigQuery </a>par exemple<br />
Et ils ont même fait <a href="http://www.apero-bigdata.com/index.html" target="_blank">un apéro Big Data </a>dans leurs bureaux à Paris !</p>
<p>Alors, réconciliés pour de bon ?</p>
]]></content:encoded>
			<wfw:commentRss></wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Revue de Presse(que parfait)</title>
		<link>https://blog.developpez.com/jmalkovich/p12281/humeurs/revue-de-presseque-parfait</link>
		<comments>https://blog.developpez.com/jmalkovich/p12281/humeurs/revue-de-presseque-parfait#comments</comments>
		<pubDate>Mon, 14 Oct 2013 21:38:40 +0000</pubDate>
		<dc:creator><![CDATA[doc malkovich]]></dc:creator>
				<category><![CDATA[big data]]></category>
		<category><![CDATA[humeurs]]></category>

		<guid isPermaLink="false">http://blog.developpez.com/jmalkovich/?p=95</guid>
		<description><![CDATA[Il arrive de voir des couacs dans les médias, des sujets mal maîtrisés et qui donnent lieu à quelques moqueries sur internet. Par exemple on se souviendra avec nostalgie de l&#8217;arrivée de windows 7 sur iphone à télématin . Ce &#8230; <a href="https://blog.developpez.com/jmalkovich/p12281/humeurs/revue-de-presseque-parfait">Lire la suite <span class="meta-nav">&#8594;</span></a>]]></description>
				<content:encoded><![CDATA[<p>Il arrive de voir des couacs dans les médias, des sujets mal maîtrisés et qui donnent lieu à quelques moqueries sur internet. Par exemple on se souviendra avec nostalgie de <a href="http://www.youtube.com/watch?v=e1cMtPMu7W4" title="windows 7 sur iphone" target="_blank">l&rsquo;arrivée de windows 7 sur iphone à télématin</a> <img src="http://www.developpez.net/forums/images/smilies/icon_cool.gif" alt="" />.</p>
<p>Ce mardi 1er octobre 2013 c&rsquo;est Natacha Polony qui nous a donné une définition un peu rapide du Big Data dans sa revue de presse sur Europe 1.<br />
<!--[if lt IE 9]><script>document.createElement('audio');</script><![endif]-->
<audio class="wp-audio-shortcode" id="audio-95-1" preload="none" style="width: 100%; visibility: hidden;" controls="controls"><source type="audio/mpeg" src="http://blog.developpez.com/jmalkovich/files/2013/10/natacha_polony_bigdata.mp3?_=1" /><a href="http://blog.developpez.com/jmalkovich/files/2013/10/natacha_polony_bigdata.mp3">http://blog.developpez.com/jmalkovich/files/2013/10/natacha_polony_bigdata.mp3</a></audio><br />
Le Big Data, c&rsquo;est quoi ? Facile, il s&rsquo;agit juste d&rsquo;après Natacha &laquo;&nbsp;des données sur Internet&nbsp;&raquo; &#8230;<br />
Rien de très révolutionnaire dans le concept me direz-vous. Mais quid des capteurs, des données GPS, des logs etc. ? Des données non structurées, des Péta-octets, de la rapidité exacerbée des traitements mis en oeuvre ?</p>
<p><img src="http://photo.europe1.fr/mediacenter/emissions/la-revue-de-presse/natacha-polony-14-10-2013/28598621-1-fre-FR/Natacha-Polony-14-10-2013_scalewidth_300.jpg" alt="" /></p>
<p>Bon, pour sa défense c&rsquo;est vrai qu&rsquo;il est difficile d&rsquo;expliquer le Big Data dans une rubrique de cinq minutes, mais il aurait été bien de mentionner que ce n&rsquo;est pas que les données sur internet loin de là ! Et puis elle a peut-être copié sur <a href="http://forums.france2.fr/france2/jtfrance2/Le20heures/data-sujet_58943_1.htm" title="France 2" target="_blank">ses amis journalistes de France 2</a> &#8230;</p>
<p>Je reste quand même fidèle à ses succulentes chroniques matinales malgré ce léger couac !</p>
]]></content:encoded>
			<wfw:commentRss></wfw:commentRss>
		<slash:comments>1</slash:comments>
<enclosure url="http://blog.developpez.com/jmalkovich/files/2013/10/natacha_polony_bigdata.mp3" length="580255" type="audio/mpeg" />
		</item>
		<item>
		<title>Critique du Big Data : Les phases du changement</title>
		<link>https://blog.developpez.com/jmalkovich/p12185/humeurs/critique-du-big-data-les-phases-du-changement</link>
		<comments>https://blog.developpez.com/jmalkovich/p12185/humeurs/critique-du-big-data-les-phases-du-changement#comments</comments>
		<pubDate>Wed, 21 Aug 2013 21:21:46 +0000</pubDate>
		<dc:creator><![CDATA[doc malkovich]]></dc:creator>
				<category><![CDATA[big data]]></category>
		<category><![CDATA[humeurs]]></category>

		<guid isPermaLink="false">http://blog.developpez.com/jmalkovich/?p=89</guid>
		<description><![CDATA[Connaissez-vous les phases du changement en entreprise ? On constate généralement quatre étapes lors d&#8217;un changement : d&#8217;abord l&#8217;étape de choc et de déni, où les utilisateurs expriment leurs craintes ; l&#8217;étape de révolte, où l&#8217;utilisateur cherche par tous les &#8230; <a href="https://blog.developpez.com/jmalkovich/p12185/humeurs/critique-du-big-data-les-phases-du-changement">Lire la suite <span class="meta-nav">&#8594;</span></a>]]></description>
				<content:encoded><![CDATA[<p>Connaissez-vous les phases du changement en entreprise ?</p>
<p>On constate généralement quatre étapes lors d&rsquo;un changement :</p>
<ol>
<li>d&rsquo;abord l&rsquo;étape de choc et de déni, où les utilisateurs expriment leurs craintes ;</li>
<li>l&rsquo;étape de révolte, où l&rsquo;utilisateur cherche par tous les moyens à empêcher la mise en oeuvre de ce changement ;</li>
<li>l&rsquo;étape d&rsquo;exploration, où les acteurs découvrent de nouvelles possibilités ;</li>
<li>et enfin l&rsquo;étape d&rsquo;acceptation, où l&rsquo;utilisateur maîtrise et motive son entourage.</li>
</ol>
<p><img src="http://lecercle.lesechos.fr/sites/default/files/gerer_le_changement_a_chaque_phase.png" alt="les phases du changement" /><br />
Le schéma est certes un peu simple, mais il s&rsquo;adapte bien aux cas réels en entreprise. Je n&rsquo;en parlerai pas plus, d&rsquo;autres le font beaucoup mieux que moi comme sur <a href="http://lecercle.lesechos.fr/entreprises-marches/management/organisation/221139633/gerer-changement-a-chaque-phase-traversee-acte">le site des échos </a>&#8230;</p>
<p>Bien sûr on pourra facilement calquer ce schéma à l&rsquo;adoption d&rsquo;une solution Big Data en entreprise ; il suffit de parler de Big Data devant la machine à café pour légitimer ce cheminement, et sans aucun doute peut-on affirmer que la première étape est inévitable et risque d&rsquo;être difficile &#8230;</p>
<p>Mais on peut aussi s&rsquo;intéresser aux réactions dans le monde extérieur ; chez les éditeurs ou sur le net les émois sont nombreux.<br />
<span id="more-89"></span></p>
<p>Retour en arrière &#8230; Fin 2010 le big data arrive sur la toile (à en croire <a href="http://www.google.fr/trends?q=%22big+data%22&amp;ctab=0&amp;geo=all&amp;date=ytd&amp;sort=0">google trends </a>). Le phénomène prend de l&rsquo;importance et certains s&rsquo;en étonnent. Comme Oracle qui en mai 2011 s&rsquo;interroge sur l&rsquo;intérêt du big data en entreprise. En mai 2011 un document de 15 pages, <a href="http://www.developpez.com/actu/37875/Oracle-veut-demystifier-la-mode-NoSQL-et-pose-la-question-des-ressources-necessaires-pour-tirer-partie-de-ces-bases-de-donnees/">Debunking the NoSQL Hype</a>, est diffusé pour convaincre les entreprises qu&rsquo;elles n&rsquo;ont pas besoin de base NoSql. &laquo;&nbsp;<em>Vous n&rsquo;êtes pas Google</em>&nbsp;&raquo; résonne comme une litanie ironique. Pourtant en octobre de la même année Oracle sort d&rsquo;un carton poussiéreux <a href="http://www.computerworld.com/s/article/9220501/Oracle_does_about_face_on_NoSQL?pageNumber=1">une base NoSql</a> fiérement montée sur son appliance&#8230; . Et depuis Oracle a sorti sa base estampillée 12c qui est parait-il taillée <a href="http://www.oracle.com/technetwork/database/bi-datawarehousing/data-warehousing-wp-12c-1896097.pdf">pour le Big Data</a>  !<br />
<a href="http://blog.developpez.com/jmalkovich/files/2013/08/sybase_big_data_mensonge.png"><img src="http://blog.developpez.com/jmalkovich/files/2013/08/sybase_big_data_mensonge.png" alt="sybase_big_data_mensonge" width="650" height="113" class="alignleft size-full wp-image-90" /></a><br />
Mais Oracle n&rsquo;est pas le seul éditeur a retourner sa veste, Sybase aussi n&rsquo;était pas prêt à mettre un kopek sur cette tendance. Dans un document intitulé &laquo;&nbsp;<a href="http://www.sybase.fr/analyticsguide">Le Décisionnel pour tous</a>&nbsp;&raquo; on pouvait même lire que &laquo;&nbsp;<em>le Big Data est un mensonge</em>&nbsp;&raquo; ! . Et pourtant dans la 15.4 on peut trouver de l&rsquo;Hadoop et une interface de programme MapReduce native utilisant SQL ! </p>
<p>Il est légitime que les éditeurs s&rsquo;affolent et défendent leurs solutions, mais on trouve aussi des traces de scepticisme dans les milieux &laquo;&nbsp;autorisés&nbsp;&raquo;, comme <a href="http://pro.01net.com/editorial/572981/serge-abiteboul-le-big-data-est-avant-tout-un-effet-de-mode/">le directeur de recherche à l&rsquo;Inria Serge Abiteboul</a> qui trouvait en avril 2012 que le big data était avant tout &laquo;&nbsp;<em>un effet de mode</em>&laquo;&nbsp;.<br />
Même le grand analyste Philippe Nieuwbourg émettait des doutes sur l&rsquo;intérêt du Big Data dans Decideo, en déclarant <a href="http://www.decideo.fr/Big-Data-on-n-attire-pas-les-mouches-avec-du-vinaigre_a4313.html">qu&rsquo;on n&rsquo;attirait pas les mouches avec du vinaigre </a> &#8230; Et pourtant il allait trouver assez d&rsquo;inspiration pour écrire un livre sur le sujet (qui n&rsquo;est toujours pas sorti d&rsquo;ailleurs à l&rsquo;heure actuelle) !</p>
<p>Comme quoi vous concluerez facilement avec moi qu&rsquo;on a abordé la dernière étape, celle de l&rsquo;acceptation ! </p>
<p>NB : </p>
<ul>
<li>Ca marche aussi avec <a href="http://it.toolbox.com/blogs/bime-saas-bi/gartner-adds-big-data-to-its-2011-hype-cycle-47969">le Hype Cycle du Gartner </a>pour ceux qui connaissent <img src="http://www.developpez.net/forums/images/smilies/icon_cool.gif" alt="8-)" /></li>
<li>Ok je concède un peu ma mauvaise foi et ma mauvaise interprétation des textes <img src="http://www.developpez.net/forums/images/smilies/icon_mrgreen.gif" alt=";-)" /></li>
</ul>
]]></content:encoded>
			<wfw:commentRss></wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Big Data &#8230; Que du bonheur</title>
		<link>https://blog.developpez.com/jmalkovich/p11975/big-data/big-data-que-du-bonheur</link>
		<comments>https://blog.developpez.com/jmalkovich/p11975/big-data/big-data-que-du-bonheur#comments</comments>
		<pubDate>Wed, 15 May 2013 21:38:34 +0000</pubDate>
		<dc:creator><![CDATA[doc malkovich]]></dc:creator>
				<category><![CDATA[big data]]></category>

		<guid isPermaLink="false">http://blog.developpez.com/jmalkovich/?p=78</guid>
		<description><![CDATA[C&#8217;est magnifique, avec le Big Data on peut tout faire, même mesurer le bonheur. C&#8217;est ce que propose une équipe de scientifiques de l’Université de Vermont et de Mitre Corporation via le site www.hedonometer.com, en référence au philosophe irlandais Francis &#8230; <a href="https://blog.developpez.com/jmalkovich/p11975/big-data/big-data-que-du-bonheur">Lire la suite <span class="meta-nav">&#8594;</span></a>]]></description>
				<content:encoded><![CDATA[<p>C&rsquo;est magnifique, avec le Big Data on peut tout faire, même mesurer le bonheur.</p>
<p>C&rsquo;est ce que propose une équipe de scientifiques de l’Université de Vermont et de Mitre Corporation via le site <a href="http://www.hedonometer.com" title="hedonometer" target="_blank">www.hedonometer.com</a>, en référence au philosophe irlandais Francis Edgeworth qui décrit à la fin du 19e siècle &laquo;&nbsp;un instrument idéal pour mesurer en permanence le degré de plaisir d&rsquo;un individu&nbsp;&raquo;.<br />
<span id="more-78"></span><br />
Ces scientifiques ont recueilli et analysé chaque jour depuis 2008 10% des tweets émis sur le web. Ils identifient ensuite les tendances, et distinguent les jours heureux et les jours tristes.</p>
<p>L&rsquo;analyse se fait sur le choix de certaines expressions, recensés dans un dictionnaire de 10.000 mots. Chaque mot a une note, comme &laquo;&nbsp;Amour&nbsp;&raquo; qui pointe à 8,42 et &laquo;&nbsp;Guerre&nbsp;&raquo; à 1,8. Le traitement de ces Big Data donne ensuite une note à chaque jour de l&rsquo;année. Le travail est effectué en hadoop sur AWS, le cloud d&rsquo;Amazon ; il faut 3 heures sur 1500 processeurs pour traiter 4 années de tweets.</p>
<p>Ainsi émergent des jours tristes, comme le 15 avril qui marque l&rsquo;attentat à la bombe sur le marathon de Boston. Et aussi des jours heureux comme Noël ou le jour de l&rsquo;an. Mais le modèle n&rsquo;est pas parfait ; ainsi le jour de la mort d&rsquo;Oussama Ben Laden est considéré plus triste que la moyenne &#8230;</p>
<p>Le sujet fait polémique ; peut-on vraiment quantifier le bonheur ? Si on vous disait de donner une note de bonheur sur vos journées, sauriez-vous la donner ? Et cela pose aussi la question de la définition du bonheur, c&rsquo;est quoi exactement ? Et si vous êtes heureux, allez-vous le tweeter ? Et si vous êtes malheureux ? Allez vous le garder pour vous ou le crier sur les toits ?</p>
<p>L&rsquo;intérêt du projet, tant sur le plan ethnique que sur le plan économique semble limité. En effet, nous n&rsquo;avons pas besoin de machine pour nous dire que nous sommes heureux à Noël et tristes lors d&rsquo;un attentat, c&rsquo;est évident ! Un autre projet s&rsquo;appuyant sur ce type de données semble plus pertinent, il s&rsquo;agit de donner les villes où il fait bon vivre en fonction des tweets géolocalisés ; attention à la flambée des prix dans la vallée du bonheur !</p>
<p>On pourra s&rsquo;inspirer du fonctionnement du programme dans le cadre d&rsquo;un projet big data, tout étant expliqué sur la <a href="http://www.hedonometer.org/about.html" title="FAQ" target="_blank">FAQ </a>du site ; on a même accès au dictionnaire de mots et leurs notes. Cette technique est à rapprocher des moteurs d&rsquo;analyse d&rsquo;opinion que l&rsquo;on peut retrouver chez certains éditeurs, outil très intéressant par exemple pour étudier le <a href="http://fr.wikipedia.org/wiki/Churn" title="churn" target="_blank">churn</a> via les commentaires clients, mais qui a ses limites comme le montre l&rsquo;exemple de la mort d&rsquo;Oussama Ben Laden ressortant comme événement triste.</p>
<p>Bref, que du bonheur <img src="https://blog.developpez.com/jmalkovich/wp-includes/images/smilies/icon_wink.gif" alt=";-)" class="wp-smiley" /></p>
]]></content:encoded>
			<wfw:commentRss></wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Soirée Big Data pour la St Valentin !</title>
		<link>https://blog.developpez.com/jmalkovich/p11752/humeurs/soiree-big-data-pour-la-st-valentin</link>
		<comments>https://blog.developpez.com/jmalkovich/p11752/humeurs/soiree-big-data-pour-la-st-valentin#comments</comments>
		<pubDate>Fri, 01 Feb 2013 16:55:51 +0000</pubDate>
		<dc:creator><![CDATA[doc malkovich]]></dc:creator>
				<category><![CDATA[big data]]></category>
		<category><![CDATA[humeurs]]></category>

		<guid isPermaLink="false">http://blog.developpez.com/jmalkovich/?p=69</guid>
		<description><![CDATA[Un événement que ne devraient pas laisser passer les nombreux informaticiens célibataires endurcis ! C&#8217;est Philippe Nieuwbourg qui l&#8217;a déniché pour vous, même si comme lui je reste sceptique sur les potentiels taux de réussite de repartir en charmante compagnie. &#8230; <a href="https://blog.developpez.com/jmalkovich/p11752/humeurs/soiree-big-data-pour-la-st-valentin">Lire la suite <span class="meta-nav">&#8594;</span></a>]]></description>
				<content:encoded><![CDATA[<p><a href="http://bigdatadatenight.eventbrite.com/">Un événement</a> que ne devraient pas laisser passer les nombreux informaticiens célibataires endurcis !</p>
<p><a href="http://blog.developpez.com/jmalkovich/p11752/humeurs/soiree-big-data-pour-la-st-valentin/attachment/i_love_big_data_t_shirt" rel="attachment wp-att-70"><img src="http://blog.developpez.com/jmalkovich/files/2013/02/i_love_big_data_t_shirt.jpg" alt="i_love_big_data_t_shirt" width="512" height="512" class="alignleft size-full wp-image-70" /></a></p>
<p>C&rsquo;est <a href="http://www.decideo.fr/bigdata/Soiree-Big-Data-pour-Geek-celibataire-a-la-St-Valentin_a38.html">Philippe Nieuwbourg</a> qui l&rsquo;a déniché pour vous, même si comme lui je reste sceptique sur les potentiels taux de réussite de repartir en charmante compagnie.</p>
<p>Ah &#8230; A quand une publicité Big Data sur adopteunmec.com ?</p>
]]></content:encoded>
			<wfw:commentRss></wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Une petite définition des Big Data</title>
		<link>https://blog.developpez.com/jmalkovich/p11226/definitions/une_petite_definition_des_big_data</link>
		<comments>https://blog.developpez.com/jmalkovich/p11226/definitions/une_petite_definition_des_big_data#comments</comments>
		<pubDate>Thu, 16 Aug 2012 11:39:31 +0000</pubDate>
		<dc:creator><![CDATA[doc malkovich]]></dc:creator>
				<category><![CDATA[big data]]></category>
		<category><![CDATA[définitions]]></category>
		<category><![CDATA[innovation / veille]]></category>

		<guid isPermaLink="false"></guid>
		<description><![CDATA[Big Data &#8230; Après le &#171;&#160;cloud&#160;&#187; c&#8217;est le nouveau terme à la mode, qu&#8217;on voit partout mais que personne ne semble connaître vraiment &#8230; Voici une petite définition que j&#8217;ai essayé de faire la plus simple possible. Comme on peut &#8230; <a href="https://blog.developpez.com/jmalkovich/p11226/definitions/une_petite_definition_des_big_data">Lire la suite <span class="meta-nav">&#8594;</span></a>]]></description>
				<content:encoded><![CDATA[<p>Big Data &#8230;</p>
<p>Après le &laquo;&nbsp;cloud&nbsp;&raquo; c&rsquo;est le nouveau terme à la mode, qu&rsquo;on voit partout mais que personne ne semble connaître vraiment &#8230;</p>
<p>Voici une petite définition que j&rsquo;ai essayé de faire la plus simple possible.<br />
<span id="more-41"></span></p>
<p>Comme on peut le deviner (si on a quelques notions d&rsquo;anglais) la notion de Big Data représente une volumétrie très importante de données. Contrairement à la BI classique il s&rsquo;agit de stocker et d&rsquo;analyser toutes (mais vraiment toutes) les données de l&rsquo;entreprise et même celles de l&rsquo;extérieur, et notamment des blogs, des forums et des réseaux sociaux.<br />
<a href="http://geekblues.com/lavenir-est-dans-le-big-data/"><img src="http://geekblues.com/wp-content/uploads/2012/08/GB0021fr.png" alt="GeekBlues" title="Big Data sur Geek Blues" /></a><br />
Quand on parle de données de l&rsquo;entreprise savez-vous que <strong>seulement 10%</strong> des données sont stockées en base (le reste étant les documents, les mails, les logs &#8230; tout le reste de la production IT quoi) ? C&rsquo;est là la limite de la BI classique : Elle ne traite que les données des bases classiques et <strong>90% des données restantes ne sont pas exploitées</strong>. C&rsquo;est un comble quand on y pense ! </p>
<p>Le défi des Big Data c&rsquo;est de pouvoir stocker ces 90% des données et de les analyser. Et c&rsquo;est là aussi un challenge important des Big Data : On a beau avoir une volumétrie colossalle de données, il faut pouvoir les traiter vite, et même très vite, voire en temps réel.</p>
<p>Mais la plupart de ces nouvelles données sont ce qu&rsquo;on appelle des données <strong>non structurées</strong>. Sous ce terme un peu complexe voire pompeux se cache en fait un concept très simple. En modélisation on a l&rsquo;habitude de structurer les données, par exemple on va faire une table Ventes avec plusieurs infos que le concepteur connait à l&rsquo;avance. Si on veut le chiffre d&rsquo;affaires des ventes d&rsquo;un produit on prendra la colonne &laquo;&nbsp;chiffre d&rsquo;affaire&nbsp;&raquo; en filtrant sur une autre colonne &laquo;&nbsp;produit&nbsp;&raquo;. En gros les données sont rangées dans des cases, prêtes à l&rsquo;emploi &#8211; elles sont dites <strong>structurées</strong>. Dans les documents et dans les messages qu&rsquo;on trouve sur les sites webs on trouve généralement des phrases qui sont composées de mots ordonnés suivant l&rsquo;envie et la culture de l&rsquo;auteur. Ces données sont dites <strong>non structurées </strong>car on ne connait pas le contenu qui serait défini comme aléatoire pour un ordinateur, il faut une réflexion humaine pour déchiffrer la donnée et pouvoir en extraire des informations. Par exemple les phrases &laquo;&nbsp;Julie va passer le weekend à Paris, elle en a de la chance !&nbsp;&raquo; et &laquo;&nbsp;A la fin de la semaine la miss va s&rsquo;éclater à paname&nbsp;&raquo; sont compréhensibles et similaires pour nous alors que l&rsquo;ordinateur ne sait les analyser et les comparer simplement. Pourtant en information on pourrait en déduire plusieurs axes d&rsquo;analyse : une personne (Julie), un temps (samedi/dimanche qui arrivent), un lieu (Paris) et un fait (présence et une opinion satisfaisante).</p>
<p>Les Big Data révolutionnent la BI en stockant ces données non structurées et en remettant au goût du jour l&rsquo;analyse sémantique. Cette dernière va permettre d&rsquo;analyser un nombre important de données et d&rsquo;en tirer des informations comme les opinions, avec des modules de datamining.</p>
<p>C&rsquo;est pourquoi on définit généralement les Big Data par <strong>les 3 V : VVV = Volume x Vitesse x Variété</strong> (volumétrie importante de données hétérogènes traitée très rapidement).</p>
<p><strong>La recette du Big Data</strong></p>
<p>Pour faire du Big Data c&rsquo;est simple. Il vous faut ;</p>
<ul>
<li>quelques Tera de base NoSQL (soit une grosse base qui n&rsquo;est pas relationnelle comme celles qu&rsquo;on connait mais qui peut tout stocker, même l&rsquo;univers diront certains)</li>
<li>quelques CPU de framework MapReduce (soit un traitement ultra rapide un peu comme ce que fait Google quand il indexe ses pages &#8230; Ah bin justement ils utilisent un tel framework, ça tombe bien)</li>
<li>quelques Mo d&rsquo;outils pour restituer les données (un peu classiques avec les bons connecteurs)</li>
<li>quelques Mo d&rsquo;outils pour analyser les données (si on veut faire un peu d&rsquo;analyse sémantique)</li>
</ul>
<p>Certains challengers sortent du lot, principalement en opensource comme :</p>
<ul>
<li>HBase, Cassandra pour les bases NoSQL</li>
<li>Hadoop en framework MapReduce (adopté partout, même par les plus grands éditeurs)</li>
</ul>
<p>Les technos citées ci-dessus sont matures et viennent des grands acteurs du web (Google, Yahoo!, etc).<br />
En ce qui concerne la BI &laquo;&nbsp;pure&nbsp;&raquo; les éditeurs s&rsquo;y mettent et nous promettent un futur resplendissant pour les Big Data.</p>
<p>Sans jeu de mots il est difficile de résumer les Big Data en quelques lignes, le sujet est vaste !</p>
<p>Quelques liens pour ceux qui voudraient aller plus loin :</p>
<ul>
<li>http://en.wikipedia.org/wiki/Big_data : la définition sur wikipedia</li>
<li>http://www.decideo.fr/bigdata/ : le blog de Philippe Nieuwbourg qui écrit un livre sur le sujet</li>
<li>http://bigdataparis.com/compte-rendu.php : les slides de la conférence Big Data Paris du 20 et 21 mars</li>
<li>http://www.kimballgroup.com/html/articles.html : The Evolving Role of the Enterprise Data Warehouse in the Era of<br />
Big Data Analytics, un article de Ralph Kimball très complet sur le sujet</li>
</ul>
]]></content:encoded>
			<wfw:commentRss></wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
