I&#39;m guessing quite a few of those 8500 words added every year -- if that number is correct -- are technical or field-specific words that should be not represented in a normal English language dictionary.  Some of these are probably slang words that don&#39;t need to be added either, at least not yet.  <div>
<br></div><div>Jim R<br><br><div class="gmail_quote">On Fri, Dec 17, 2010 at 11:31 AM, Gilliatt, Cynthia Ann - gilliaca <span dir="ltr">&lt;<a href="mailto:gilliaca@jmu.edu">gilliaca@jmu.edu</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">
<br>
.this in today&#39;s Guardian about two &quot;culturomics&quot; researchers at Harvard who are using Google data and $ to study the English language &quot;genome&quot;:<br>
<div class="im"><br>
&quot;In their initial analysis of the database, the team found that around 8,500 new words enter the English language every year and the lexicon grew by 70% between 1950 and 2000. But most of these words do not appear in dictionaries. &quot;We estimated that 52% of the English lexicon – the majority of words used in English books – consist of lexical &#39;dark matter&#39; undocumented in standard references,&quot; they wrote in the journal Science (the full paper is available with free online registration).&quot;<br>

<br>
</div>So how did their computerknow they were words?  And what dictionaries did they use?  Did they include proper names?<br>
<div class="im"><br>
<br>
&quot;Let&#39;s talk a bit about terms like &quot;culturomics&quot; and &quot;genome&quot; and the apparent need to sound like a scientist (a wacky scientist at that) in order to be taken seriously by the media and govt grant dispensers these days.&quot;<br>

</div>Good topic.<br>
<div class="im"><br>
&quot;But first, let me try to cast some doubt on the notion that 52 % of the English lexicon (as represented by 4 % of the books ever published in English) the majority of words used in English books do not appear in any dictionaries or other reference books.&quot;<br>

</div>Which 4% of books printed in English?  Who chose?  Did they include texts in  Early Modern English? Or were the texts all 20th/21st c?<br>
<div class="im"><br>
<br>
 &quot;This claim falls so far outside my experience as a reader and dictionary user that I want say. Are you kidding?  Maybe their computer algorithm is good at searching a word database and very very poor at using a dictionary. I suspect that their search algorithm (Harvard&#39;s, not Google&#39;s) fails to allow for any sort of conjugation and inflection, so, for example, the word, &quot;indirectly&quot; comes up as &quot;dark matter.&quot;&quot;<br>

<br>
</div>Dark matter indeed. Well worth discussing.   Thanks.<br>
<div><div></div><div class="h5">C<br>
_______________________________________________<br>
Milton-L mailing list<br>
<a href="mailto:Milton-L@lists.richmond.edu">Milton-L@lists.richmond.edu</a><br>
Manage your list membership and access list archives at <a href="http://lists.richmond.edu/mailman/listinfo/milton-l" target="_blank">http://lists.richmond.edu/mailman/listinfo/milton-l</a><br>
<br>
Milton-L web site: <a href="http://johnmilton.org/" target="_blank">http://johnmilton.org/</a><br>
</div></div></blockquote></div><br><br clear="all"><br>-- <br>Dr. James Rovira<br>Program Chair of Humanities<br>Assistant Professor of English<br>Tiffin University<br>155 Miami Street<br>Tiffin, OH 44883<br>(419) 448-3586<br>
<a href="mailto:roviraj@tiffin.edu">roviraj@tiffin.edu</a><br>Blake and Kierkegaard: Creation and Anxiety<br><a href="http://www.continuumbooks.com">http://www.continuumbooks.com</a><br><br>
</div>