From 2e8d275e1148fe3e1629461378735fab76059c71 Mon Sep 17 00:00:00 2001
From: Linus Lee <linus@thesephist.com>
Date: Thu, 21 Jul 2022 10:45:20 -0400
Subject: [PATCH] docs: Add code annotations

---
 docs/lib/search.ts.html  | 216 ++++++++++++++++++-------------
 docs/test/search.js.html | 268 +++++++++++++++++++++------------------
 lib/search.ts            |  98 ++++++++++----
 3 files changed, 349 insertions(+), 233 deletions(-)
diff --git a/docs/lib/search.ts.html b/docs/lib/search.ts.html
index ded38c3..0729ced 100644
--- a/docs/lib/search.ts.html
+++ b/docs/lib/search.ts.html
@@ -17,105 +17,151 @@ <h1>./lib/search.ts <span class="fade">annotated source</span></h1>
             </div>
             <pre></pre>
         </div>
-        <div class="line"><div class="doc"><h2 id="basic-principles">Basic principles</h2>
-</div><pre class="source javascript"><strong class="lineNumber">2</strong></pre></div>
+        <div class="line"><div class="doc"><p><strong>libsearch</strong> is the core text search algorithm that I&#39;ve polished and
+reused over the years across <a href="https://thesephist/projects">many of my personal
+projects</a> for fast and simple full-text
+search, packaged into a small single-purpose JavaScript library.</p>
+<p>For how to import and use in your own project, and for canonical
+documentation, check out the <a href="https://github.com/thesephist/libsearch">GitHub repository
+page</a>.</p>
+</div><pre class="source javascript"><strong class="lineNumber">9</strong></pre></div>
 <div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber"></strong></pre></div>
-<div class="line"><div class="doc"><p>TODO: Explain stuff...</p>
-</div><pre class="source javascript"><strong class="lineNumber">4</strong></pre></div>
+<div class="line"><div class="doc"><h2 id="basic-principles">Basic principles</h2>
+<p>libsearch uses two tricks to return full-text search results that are
+reasonably good: (1) index-free, regular expression-based string search and
+(2) TF-IDF ranking based on those RegExp matches:</p>
+<ol>
+<li>Rather than using a pre-built index that maps tokens to documents, which
+requires maintenance to be kept up-to-date every time the underlying
+corpus changes, libsearch transforms the search query into regular
+expressions that progressively filter the corpus. In theory, this is
+O(n), but in practice, for small enough n (MBs of text), this is good
+enough.</li>
+<li>The conventional TF-IDF formula requires knowing the number of tokens in
+every document. This requires either a pre-built index, or is
+computationally expensive, so instead we approximate this using the
+character count of the document. Using JavaScript&#39;s RegExp#exec with a
+global regular expression lets us quickly count the number of matches of
+a keyword in a document. Using these tricks, libsearch uses the formula:</li>
+</ol>
+<h1 id="tokens--doclength--log-docs---matching-docs">tokens / doc.length * log(# docs / # matching docs)</h1>
+</div><pre class="source javascript"><strong class="lineNumber">30</strong></pre></div>
 <div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber"></strong></pre></div>
 <div class="line"><div class="doc"><h2 id="implementation">Implementation</h2>
-</div><pre class="source javascript"><strong class="lineNumber">6</strong></pre></div>
+</div><pre class="source javascript"><strong class="lineNumber">32</strong></pre></div>
 <div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber"></strong></pre></div>
 <div class="line"><div class="doc"><p>To turn every potential query into a regular expression, we need to be able
-to escape key characters.</p>
-</div><pre class="source javascript"><strong class="lineNumber">9</strong>function escapeForRegExp(text: string): string {</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">10</strong>    return text.replace(/[.*+?^${}[\]()|\\]/g, '\\$1');</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">11</strong>}</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">12</strong></pre></div>
+to escape characters that are significant in RegExp.</p>
+</div><pre class="source javascript"><strong class="lineNumber">35</strong>function escapeForRegExp(text: string): string {</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">36</strong>    return text.replace(/[.*+?^${}[\]()|\\]/g, '\\$1');</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">37</strong>}</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">38</strong></pre></div>
 <div class="line"><div class="doc"><p>Utility function for sorting an array by some predicate, rather than a
-comparator function.</p>
-</div><pre class="source javascript"><strong class="lineNumber">15</strong>function sortBy&#60;T&#62;(items: T[], by: (_it: T) =&#62; any): T[] {</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">16</strong>    return items.sort((a, b) =&#62; {</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">17</strong>        const aby = by(a);</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">18</strong>        const bby = by(b);</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">19</strong>        if (aby &#60; bby) {</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">20</strong>            return 1;</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">21</strong>        }</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">22</strong>        if (bby &#60; aby) {</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">23</strong>            return -1;</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">24</strong>        }</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">25</strong>        return 0;</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">26</strong>    });</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">27</strong>}</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">28</strong></pre></div>
-<div class="line"><div class="doc"><p>The main search function takes:</p>
+comparator function. This implementation assumes <code>by(it)</code> is very cheap.</p>
+</div><pre class="source javascript"><strong class="lineNumber">41</strong>function sortBy&#60;T&#62;(items: T[], by: (_it: T) =&#62; any): T[] {</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">42</strong>    return items.sort((a, b) =&#62; {</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">43</strong>        const aby = by(a);</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">44</strong>        const bby = by(b);</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">45</strong>        if (aby &#60; bby) {</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">46</strong>            return 1;</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">47</strong>        }</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">48</strong>        if (bby &#60; aby) {</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">49</strong>            return -1;</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">50</strong>        }</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">51</strong>        return 0;</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">52</strong>    });</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">53</strong>}</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">54</strong></pre></div>
+<div class="line"><div class="doc"><p>The search function takes:</p>
 <ul>
 <li><code>items</code>, the list of items to search</li>
 <li><code>query</code>, the search query text</li>
-<li><code>by</code>, which is a predicate (string, number, or function) that takes an item from the items list and returns the string that should be matched with the query</li>
+<li><code>by</code>, which is a predicate function that takes an item from the items
+list and returns the string that should be matched with the query</li>
+<li><code>options</code>, a dictionary of options:</li>
 </ul>
 <p>Options include</p>
 <ul>
 <li><code>caseSensitive</code>, which is self-explanatory</li>
-<li><code>mode</code>: which is &#39;word&#39; or &#39;prefix&#39; (&#39;prefix&#39; by default)</li>
+<li><code>mode</code>: which is &#39;word&#39;, &#39;prefix&#39;, or &#39;autocomplete&#39; (&#39;autocomplete&#39; by
+default), determining the way in which partial matches are processed</li>
 </ul>
-</div><pre class="source javascript"><strong class="lineNumber">37</strong>export function search&#60;T&#62;(items: T[], query: string, by: (_it: T) =&#62; any = x =&#62; x, {</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">38</strong>    caseSensitive = false,</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">39</strong>    mode = 'prefix',</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">40</strong>}: {</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">41</strong>    caseSensitive?: boolean;</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">42</strong>    mode?: 'word' | 'prefix';</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">43</strong>} = {}) {</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">44</strong>    function countMatches(s: string, regexp: RegExp): number {</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">45</strong>        let i = 0;</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">46</strong>        while (regexp.exec(s) !== null) {</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">47</strong>            i ++;</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">48</strong>        }</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">49</strong>        return i;</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">50</strong>    }</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">51</strong></pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">52</strong>    const words = query</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">53</strong>        .trim()</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">54</strong>        .split(' ')</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">55</strong>        .filter(s =&#62; s !== '');</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">56</strong></pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">57</strong>    if (words.length === 0) {</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">58</strong>        return items;</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">59</strong>    }</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">60</strong></pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">61</strong>    const tfidf = new Map&#60;T, number&#62;();</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">62</strong>    const suggestions = words.reduce((suggestions, word, i) =&#62; {</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">63</strong>        const isLastWord = i + 1 === words.length;</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">64</strong>        const regexp = new RegExp(</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">65</strong>            '(^|\\W)' + escapeForRegExp(word) + (isLastWord || mode === 'prefix' ? '' : '($|\\W)'),</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">66</strong>            // the "u" flag for Unicode used to be used here, but was removed</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">67</strong>            // because it was (1) across-the-board too slow, and removing it</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">68</strong>            // made a statistically significant speed improvement, and (2)</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">69</strong>            // caused at least Chrome to have strange performance cliffs in</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">70</strong>            // unpredictable ways where certain regexp operations would take</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">71</strong>            // 10s of ms.</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">72</strong>            caseSensitive ? 'mg' : 'img'</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">73</strong>        );</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">74</strong>        return suggestions.filter(sugg =&#62; {</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">75</strong>            const text = by(sugg);</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">76</strong>            const count = countMatches(text, regexp);</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">77</strong>            if (count === 0) {</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">78</strong>                return false;</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">79</strong>            }</pre></div>
-<div class="line"><div class="doc"><p>TF-IDF weighting per-term</p>
-</div><pre class="source javascript"><strong class="lineNumber">81</strong>            tfidf.set(</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">82</strong>                sugg,</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">83</strong>                (tfidf.get(sugg) || 0)</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">84</strong>                    + (count / text.length * Math.log(items.length / suggestions.length))</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">85</strong>            );</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">86</strong>            return true;</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">87</strong>        })</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">88</strong>    }, items);</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">89</strong></pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">90</strong>    return sortBy(suggestions, sugg =&#62; tfidf.get(sugg));</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">91</strong>}</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">92</strong></pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">93</strong></pre></div>
+</div><pre class="source javascript"><strong class="lineNumber">66</strong>export function search&#60;T&#62;(items: T[], query: string, by: (_it: T) =&#62; any = x =&#62; x, {</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">67</strong>    caseSensitive = false,</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">68</strong>    mode = 'autocomplete',</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">69</strong>}: {</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">70</strong>    caseSensitive?: boolean;</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">71</strong>    mode?: 'word' | 'prefix' | 'autocomplete';</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">72</strong>} = {}) {</pre></div>
+<div class="line"><div class="doc"><p><code>countMatches</code> counts the number of times <code>regexp</code> occurs in the string
+<code>s</code>. We need this information for ranking, where documents that mention
+the keyword more times (relative to the total word count of the
+document) are ranked higher.</p>
+</div><pre class="source javascript"><strong class="lineNumber">77</strong>    function countMatches(s: string, regexp: RegExp): number {</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">78</strong>        let i = 0;</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">79</strong>        while (regexp.exec(s) !== null) {</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">80</strong>            i ++;</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">81</strong>        }</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">82</strong>        return i;</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">83</strong>    }</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">84</strong></pre></div>
+<div class="line"><div class="doc"><p>We chunk up the query string into a list of &quot;words&quot;, each of which will
+become a regular expression filter.</p>
+</div><pre class="source javascript"><strong class="lineNumber">87</strong>    const words = query</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">88</strong>        .trim()</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">89</strong>        .split(/\s+/)</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">90</strong>        .filter(s =&#62; s !== '');</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">91</strong></pre></div>
+<div class="line"><div class="doc"><p>Short-circuit if the search query is empty -- return the original list.
+This is a sensible default because in most apps this corresponds to the
+&quot;home view&quot; of the list, where a search has not been performed.</p>
+</div><pre class="source javascript"><strong class="lineNumber">95</strong>    if (words.length === 0) {</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">96</strong>        return items;</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">97</strong>    }</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">98</strong></pre></div>
+<div class="line"><div class="doc"><p>For every word in the search query, we&#39;re going to keep track of every
+document&#39;s TF-IDF value in this map, and aggregate them together by the
+end for sorting.</p>
+</div><pre class="source javascript"><strong class="lineNumber">102</strong>    const tfidf = new Map&#60;T, number&#62;();</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">103</strong></pre></div>
+<div class="line"><div class="doc"><p>Iterate through every word in the query and progressively filter down
+<code>items</code> to just the documents that match every query word.</p>
+</div><pre class="source javascript"><strong class="lineNumber">106</strong>    const results = words.reduce((results, word, i) =&#62; {</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">107</strong>        const isLastWord = i + 1 === words.length;</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">108</strong>        const regexp = new RegExp(</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">109</strong>            '(^|\\W)'</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">110</strong>                + escapeForRegExp(word)</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">111</strong>                + ((mode === 'autocomplete' &#38;&#38; isLastWord) || mode === 'prefix' ? '' : '($|\\W)'),</pre></div>
+<div class="line"><div class="doc"><p>The &#39;u&#39; flag for Unicode used to be used here, but was removed
+because it was (1) across-the-board too slow, and removing it
+made a statistically significant speed improvement, and (2)
+caused at least Chrome to have strange performance cliffs in
+unpredictable ways where certain RegExp operations would take
+10s of ms.</p>
+</div><pre class="source javascript"><strong class="lineNumber">118</strong>            caseSensitive ? 'mg' : 'img'</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">119</strong>        );</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">120</strong>        return results.filter(result =&#62; {</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">121</strong>            const text = by(result);</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">122</strong>            const count = countMatches(text, regexp);</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">123</strong>            if (count === 0) {</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">124</strong>                return false;</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">125</strong>            }</pre></div>
+<div class="line"><div class="doc"><p>Compute the TF-IDF value for this <code>word</code>, and add it to this
+result&#39;s TF-IDF value so far.</p>
+</div><pre class="source javascript"><strong class="lineNumber">128</strong>            tfidf.set(</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">129</strong>                result,</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">130</strong>                (tfidf.get(result) || 0)</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">131</strong>                    + (count / text.length * Math.log(items.length / results.length))</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">132</strong>            );</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">133</strong>            return true;</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">134</strong>        })</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">135</strong>    }, items);</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">136</strong></pre></div>
+<div class="line"><div class="doc"><p>Sort the results list by our ranking metric, TF-IDF</p>
+</div><pre class="source javascript"><strong class="lineNumber">138</strong>    return sortBy(results, result =&#62; tfidf.get(result));</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">139</strong>}</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">140</strong></pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">141</strong></pre></div>
     </main>
     <link rel="stylesheet" href="//cdnjs.cloudflare.com/ajax/libs/highlight.js/9.13.1/styles/github-gist.min.css">
     <script src="//cdnjs.cloudflare.com/ajax/libs/highlight.js/9.13.1/highlight.min.js"></script>
diff --git a/docs/test/search.js.html b/docs/test/search.js.html
index abf7ba0..6f1b6db 100644
--- a/docs/test/search.js.html
+++ b/docs/test/search.js.html
@@ -20,135 +20,157 @@ <h1>./test/search.js <span class="fade">annotated source</span></h1>
         <div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">1</strong>import {strict as assert} from 'node:assert';</pre></div>
 <div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">2</strong>import {search} from '../dist/search.js';</pre></div>
 <div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">3</strong></pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">4</strong>function item(name) {</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">5</strong>    return {name};</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">6</strong>}</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">7</strong></pre></div>
-<div class="line"><div class="doc"><p>Most of the tests work on this pre-set list of items to search</p>
-</div><pre class="source javascript"><strong class="lineNumber">9</strong>const ITEMS = [</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">10</strong>    item('Linus Lee'),</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">11</strong>    item('@thesephist'),</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">12</strong>    item('@geohot'),</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">13</strong>    item('linuslee'),</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">14</strong>    item('linus is a person'),</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">15</strong>    item('@dlwlrma'),</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">16</strong>];</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">17</strong></pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">18</strong>describe('basic search', () =&#62; {</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">19</strong>    it('search empty array', () =&#62; {</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">20</strong>        assert.deepEqual(search([], 'query', x =&#62; x.name), []);</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">21</strong>    });</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">22</strong></pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">23</strong>    it('search with empty query', () =&#62; {</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">24</strong>        assert.deepEqual(search(ITEMS, '', x =&#62; x.name), ITEMS);</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">25</strong>    });</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">26</strong></pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">27</strong>    it('search with 1 letter returns correct result', () =&#62; {</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">28</strong>        assert.deepEqual(search(ITEMS, 'l', x =&#62; x.name), [</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">29</strong>            item('Linus Lee'),</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">30</strong>            item('linuslee'),</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">31</strong>            item('linus is a person'),</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">32</strong>        ]);</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">33</strong>    });</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">34</strong></pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">35</strong>    it('multi-word search returns correct result', () =&#62; {</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">36</strong>        assert.deepEqual(search(ITEMS, 'linus lee', x =&#62; x.name), [</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">37</strong>            item('Linus Lee'),</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">38</strong>        ]);</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">39</strong>    });</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">40</strong></pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">41</strong>    it('searching words out of order returns correct result', () =&#62; {</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">42</strong>        assert.deepEqual(search(ITEMS, 'lee linus', x =&#62; x.name), [</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">43</strong>            item('Linus Lee'),</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">44</strong>        ]);</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">45</strong>    });</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">46</strong></pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">47</strong>    it('search works even if the last query word is incomplete', () =&#62; {</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">48</strong>        assert.deepEqual(search(ITEMS, 'linus le', x =&#62; x.name), [</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">49</strong>            item('Linus Lee'),</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">50</strong>        ]);</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">51</strong>    });</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">52</strong></pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">53</strong>    it('correctly implements TF-IDF ranking', () =&#62; {</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">4</strong>const item = name =&#62; ({name});</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">5</strong></pre></div>
+<div class="line"><div class="doc"><p>Most of the tests operate on this pre-set list of items to search</p>
+</div><pre class="source javascript"><strong class="lineNumber">7</strong>const ITEMS = [</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">8</strong>    item('Linus Lee'),</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">9</strong>    item('@thesephist'),</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">10</strong>    item('@geohot'),</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">11</strong>    item('linuslee'),</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">12</strong>    item('linus is a person'),</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">13</strong>    item('@dlwlrma'),</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">14</strong>];</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">15</strong></pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">16</strong>describe('basic search', () =&#62; {</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">17</strong>    it('search empty array', () =&#62; {</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">18</strong>        assert.deepEqual(search([], 'query', x =&#62; x.name), []);</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">19</strong>    });</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">20</strong></pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">21</strong>    it('search with empty query', () =&#62; {</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">22</strong>        assert.deepEqual(search(ITEMS, '', x =&#62; x.name), ITEMS);</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">23</strong>    });</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">24</strong></pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">25</strong>    it('search with 1 letter returns correct result', () =&#62; {</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">26</strong>        assert.deepEqual(search(ITEMS, 'l', x =&#62; x.name), [</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">27</strong>            item('Linus Lee'),</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">28</strong>            item('linuslee'),</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">29</strong>            item('linus is a person'),</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">30</strong>        ]);</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">31</strong>    });</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">32</strong></pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">33</strong>    it('search does not match from middle of words', () =&#62; {</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">34</strong>        assert.deepEqual(search(ITEMS, 'w', x =&#62; x.name), []);</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">35</strong>    });</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">36</strong></pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">37</strong>    it('multi-word search returns correct result', () =&#62; {</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">38</strong>        assert.deepEqual(search(ITEMS, 'linus lee', x =&#62; x.name), [</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">39</strong>            item('Linus Lee'),</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">40</strong>        ]);</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">41</strong>    });</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">42</strong></pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">43</strong>    it('searching words out of order returns correct result', () =&#62; {</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">44</strong>        assert.deepEqual(search(ITEMS, 'lee linus', x =&#62; x.name), [</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">45</strong>            item('Linus Lee'),</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">46</strong>        ]);</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">47</strong>    });</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">48</strong></pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">49</strong>    it('search works even if the last query word is incomplete', () =&#62; {</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">50</strong>        assert.deepEqual(search(ITEMS, 'linus le', x =&#62; x.name), [</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">51</strong>            item('Linus Lee'),</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">52</strong>        ]);</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">53</strong>    });</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">54</strong></pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">55</strong>    it('search query may contain newlines, tabs, and multiple consecutive spaces', () =&#62; {</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">56</strong>        assert.deepEqual(search(ITEMS, '  linus\t is\nperson\t', x =&#62; x.name), [</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">57</strong>            item('linus is a person'),</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">58</strong>        ]);</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">59</strong>    });</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">60</strong></pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">61</strong>    it('correctly implements TF-IDF ranking', () =&#62; {</pre></div>
 <div class="line"><div class="doc"><p>In this example, &quot;mango&quot; has much higher IDF (is a higher-signal
 word) in the corpus than &quot;apple&quot;, which appears in nearly every
 document. Therefore,</p>
-</div><pre class="source javascript"><strong class="lineNumber">57</strong>        assert.deepEqual(</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">58</strong>            search([</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">59</strong>                // matches</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">60</strong>                item('mango mango mango apple'),</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">61</strong>                item('mango apple mango apple'),</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">62</strong>                item('apple mango apple mango apple mango apple mango'),</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">63</strong>                item('apple apple apple apple apple apple apple apple mango'),</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">64</strong>                // rejects</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">65</strong>                item('apple apple apple'),</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">66</strong>                item('mango mango mango'),</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">67</strong>                item('applemango'),</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">68</strong>                item('mangoapple'),</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">69</strong>                item('apple 1'),</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">70</strong>                item('apple 2'),</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">71</strong>                item('apple 3'),</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">72</strong>                item('apple 4'),</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">73</strong>                item('apple 5'),</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">74</strong>                item('apple 6'),</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">75</strong>                item('apple 7'),</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">76</strong>                item('apple 8'),</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">77</strong>                item('apple 9'),</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">78</strong>            ], 'apple mango', x =&#62; x.name),</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">79</strong>            [</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">80</strong>                item('mango mango mango apple'),</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">81</strong>                item('mango apple mango apple'),</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">82</strong>                item('apple mango apple mango apple mango apple mango'),</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">83</strong>                item('apple apple apple apple apple apple apple apple mango'),</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">84</strong>            ]</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">85</strong>        );</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">86</strong>    });</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">87</strong>});</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">88</strong></pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">89</strong>describe('custom search-by predicates', () =&#62; {</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">90</strong>    it('default predicate is provided as x =&#62; x', () =&#62; {</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">91</strong>        assert.deepEqual(</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">92</strong>            search([</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">93</strong>                'university',</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">94</strong>                'uni of california',</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">95</strong>                'university of california',</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">96</strong>            ], 'uni of cali'),</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">97</strong>            [</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">98</strong>                'uni of california',</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">99</strong>                'university of california',</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">100</strong>            ]</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">101</strong>        );</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">102</strong>    });</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">103</strong></pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">104</strong>    it('accepts and uses a custom predicate', () =&#62; {</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">105</strong>        assert.deepEqual(search(ITEMS, 'sunil ee', x =&#62; x.name.split('').reverse().join('')), [</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">106</strong>            item('Linus Lee'),</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">107</strong>        ]);</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">108</strong>    });</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">109</strong>});</pre></div>
+</div><pre class="source javascript"><strong class="lineNumber">65</strong>        assert.deepEqual(</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">66</strong>            search([</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">67</strong>                // matches</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">68</strong>                item('mango mango mango apple'),</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">69</strong>                item('mango apple mango apple'),</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">70</strong>                item('apple mango apple mango apple mango apple mango'),</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">71</strong>                item('apple apple apple apple apple apple apple apple mango'),</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">72</strong>                // rejects</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">73</strong>                item('apple apple apple'),</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">74</strong>                item('mango mango mango'),</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">75</strong>                item('applemango'),</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">76</strong>                item('mangoapple'),</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">77</strong>                item('apple 1'),</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">78</strong>                item('apple 2'),</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">79</strong>                item('apple 3'),</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">80</strong>                item('apple 4'),</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">81</strong>                item('apple 5'),</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">82</strong>                item('apple 6'),</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">83</strong>                item('apple 7'),</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">84</strong>                item('apple 8'),</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">85</strong>                item('apple 9'),</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">86</strong>            ], 'apple mango', x =&#62; x.name),</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">87</strong>            [</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">88</strong>                item('mango mango mango apple'),</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">89</strong>                item('mango apple mango apple'),</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">90</strong>                item('apple mango apple mango apple mango apple mango'),</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">91</strong>                item('apple apple apple apple apple apple apple apple mango'),</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">92</strong>            ]</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">93</strong>        );</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">94</strong>    });</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">95</strong>});</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">96</strong></pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">97</strong>describe('custom search-by predicates', () =&#62; {</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">98</strong>    it('default predicate is provided as x =&#62; x', () =&#62; {</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">99</strong>        assert.deepEqual(</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">100</strong>            search([</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">101</strong>                'university',</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">102</strong>                'uni of california',</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">103</strong>                'university of california',</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">104</strong>            ], 'uni of cali'),</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">105</strong>            [</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">106</strong>                'uni of california',</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">107</strong>            ]</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">108</strong>        );</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">109</strong>    });</pre></div>
 <div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">110</strong></pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">111</strong>describe('search modes', () =&#62; {</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">112</strong>    it('in mode: prefix, every query word can be incomplete', () =&#62; {</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">113</strong>        assert.deepEqual(search(ITEMS, 'linu le', x =&#62; x.name, {mode: 'prefix'}), [</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">114</strong>            item('Linus Lee'),</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">115</strong>        ])</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">116</strong>    });</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">111</strong>    it('accepts and uses a custom predicate', () =&#62; {</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">112</strong>        assert.deepEqual(search(ITEMS, 'sunil ee', x =&#62; x.name.split('').reverse().join('')), [</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">113</strong>            item('Linus Lee'),</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">114</strong>        ]);</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">115</strong>    });</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">116</strong>});</pre></div>
 <div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">117</strong></pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">118</strong>    it('in mode: word, search does not match if non-last words are incomplete', () =&#62; {</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">119</strong>        assert.deepEqual(search(ITEMS, 'linu lee', x =&#62; x.name, {mode: 'word'}), []);</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">120</strong>    });</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">121</strong>});</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">118</strong>describe('search modes', () =&#62; {</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">119</strong>    it('in mode: word, search does not match if any words are incomplete', () =&#62; {</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">120</strong>        assert.deepEqual(search(ITEMS, 'linu lee', x =&#62; x.name, {mode: 'word'}), []);</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">121</strong>    });</pre></div>
 <div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">122</strong></pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">123</strong>describe('case sensitivity', () =&#62; {</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">124</strong>    it('caseSensitive: true omits non-matching results', () =&#62; {</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">125</strong>        assert.deepEqual(search(ITEMS, 'l', x =&#62; x.name, {caseSensitive: true}), [</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">126</strong>            item('linuslee'),</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">127</strong>            item('linus is a person'),</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">128</strong>        ]);</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">129</strong>    });</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">130</strong>});</pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">131</strong></pre></div>
-<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">132</strong></pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">123</strong>    it('in mode: prefix, every query word may be incomplete', () =&#62; {</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">124</strong>        assert.deepEqual(search(ITEMS, 'linu le', x =&#62; x.name, {mode: 'prefix'}), [</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">125</strong>            item('Linus Lee'),</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">126</strong>        ]);</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">127</strong>    });</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">128</strong></pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">129</strong>    it('in mode: autocomplete, only the last query word may be incomplete', () =&#62; {</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">130</strong>        assert.deepEqual(search(ITEMS, 'linus le', x =&#62; x.name, {mode: 'autocomplete'}), [</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">131</strong>            item('Linus Lee'),</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">132</strong>        ]);</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">133</strong>        assert.deepEqual(search(ITEMS, 'linu le', x =&#62; x.name, {mode: 'autocomplete'}), []);</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">134</strong>    });</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">135</strong>});</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">136</strong></pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">137</strong>describe('case sensitivity', () =&#62; {</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">138</strong>    it('caseSensitive: true omits non-matching results', () =&#62; {</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">139</strong>        assert.deepEqual(search(ITEMS, 'l', x =&#62; x.name, {caseSensitive: true}), [</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">140</strong>            item('linuslee'),</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">141</strong>            item('linus is a person'),</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">142</strong>        ]);</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">143</strong>    });</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">144</strong></pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">145</strong>    it('caseSensitive: false includes case-insensitive results', () =&#62; {</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">146</strong>        assert.deepEqual(search(ITEMS, 'l', x =&#62; x.name, {caseSensitive: false}), [</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">147</strong>            item('Linus Lee'),</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">148</strong>            item('linuslee'),</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">149</strong>            item('linus is a person'),</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">150</strong>        ]);</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">151</strong>    });</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">152</strong>});</pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">153</strong></pre></div>
+<div class="line"><div class="doc"></div><pre class="source javascript"><strong class="lineNumber">154</strong></pre></div>
     </main>
     <link rel="stylesheet" href="//cdnjs.cloudflare.com/ajax/libs/highlight.js/9.13.1/styles/github-gist.min.css">
     <script src="//cdnjs.cloudflare.com/ajax/libs/highlight.js/9.13.1/highlight.min.js"></script>
diff --git a/lib/search.ts b/lib/search.ts
index fe61f8b..e2faf6e 100644
--- a/lib/search.ts
+++ b/lib/search.ts
@@ -1,17 +1,43 @@
-//> ## Basic principles
+//> **libsearch** is the core text search algorithm that I've polished and
+//  reused over the years across [many of my personal
+//  projects](https://thesephist/projects) for fast and simple full-text
+//  search, packaged into a small single-purpose JavaScript library.
+//
+//  For how to import and use in your own project, and for canonical
+//  documentation, check out the [GitHub repository
+//  page](https://github.com/thesephist/libsearch).
 
-//> TODO: Explain stuff...
+//> ## Basic principles
+//
+//  libsearch uses two tricks to return full-text search results that are
+//  reasonably good: (1) index-free, regular expression-based string search and
+//  (2) TF-IDF ranking based on those RegExp matches:
+//
+//  1. Rather than using a pre-built index that maps tokens to documents, which
+//     requires maintenance to be kept up-to-date every time the underlying
+//     corpus changes, libsearch transforms the search query into regular
+//     expressions that progressively filter the corpus. In theory, this is
+//     O(n), but in practice, for small enough n (MBs of text), this is good
+//     enough.
+//  2. The conventional TF-IDF formula requires knowing the number of tokens in
+//     every document. This requires either a pre-built index, or is
+//     computationally expensive, so instead we approximate this using the
+//     character count of the document. Using JavaScript's RegExp#exec with a
+//     global regular expression lets us quickly count the number of matches of
+//     a keyword in a document. Using these tricks, libsearch uses the formula:
+//
+//         # tokens / doc.length * log(# docs / # matching docs)
 
 //> ## Implementation
 
 //> To turn every potential query into a regular expression, we need to be able
-//  to escape key characters.
+//  to escape characters that are significant in RegExp.
 function escapeForRegExp(text: string): string {
     return text.replace(/[.*+?^${}[\]()|\\]/g, '\\$1');
 }
 
 //> Utility function for sorting an array by some predicate, rather than a
-//  comparator function.
+//  comparator function. This implementation assumes `by(it)` is very cheap.
 function sortBy<T>(items: T[], by: (_it: T) => any): T[] {
     return items.sort((a, b) => {
         const aby = by(a);
@@ -26,21 +52,28 @@ function sortBy<T>(items: T[], by: (_it: T) => any): T[] {
     });
 }
 
-//> The main search function takes:
+//> The search function takes:
 //  - `items`, the list of items to search
 //  - `query`, the search query text
-//  - `by`, which is a predicate (string, number, or function) that takes an item from the items list and returns the string that should be matched with the query
+//  - `by`, which is a predicate function that takes an item from the items
+//    list and returns the string that should be matched with the query
+//  - `options`, a dictionary of options:
 //
 //  Options include
 //  - `caseSensitive`, which is self-explanatory
-//  - `mode`: which is 'word' or 'prefix' ('prefix' by default)
+//  - `mode`: which is 'word', 'prefix', or 'autocomplete' ('autocomplete' by
+//    default), determining the way in which partial matches are processed
 export function search<T>(items: T[], query: string, by: (_it: T) => any = x => x, {
     caseSensitive = false,
-    mode = 'prefix',
+    mode = 'autocomplete',
 }: {
     caseSensitive?: boolean;
-    mode?: 'word' | 'prefix';
+    mode?: 'word' | 'prefix' | 'autocomplete';
 } = {}) {
+    //> `countMatches` counts the number of times `regexp` occurs in the string
+    //  `s`. We need this information for ranking, where documents that mention
+    //  the keyword more times (relative to the total word count of the
+    //  document) are ranked higher.
     function countMatches(s: string, regexp: RegExp): number {
         let i = 0;
         while (regexp.exec(s) !== null) {
@@ -49,44 +82,59 @@ export function search<T>(items: T[], query: string, by: (_it: T) => any = x =>
         return i;
     }
 
+    //> We chunk up the query string into a list of "words", each of which will
+    //  become a regular expression filter.
     const words = query
         .trim()
-        .split(' ')
+        .split(/\s+/)
         .filter(s => s !== '');
 
+    //> Short-circuit if the search query is empty -- return the original list.
+    //  This is a sensible default because in most apps this corresponds to the
+    //  "home view" of the list, where a search has not been performed.
     if (words.length === 0) {
         return items;
     }
 
+    //> For every word in the search query, we're going to keep track of every
+    //  document's TF-IDF value in this map, and aggregate them together by the
+    //  end for sorting.
     const tfidf = new Map<T, number>();
-    const suggestions = words.reduce((suggestions, word, i) => {
+
+    //> Iterate through every word in the query and progressively filter down
+    //  `items` to just the documents that match every query word.
+    const results = words.reduce((results, word, i) => {
         const isLastWord = i + 1 === words.length;
         const regexp = new RegExp(
-            '(^|\\W)' + escapeForRegExp(word) + (isLastWord || mode === 'prefix' ? '' : '($|\\W)'),
-            // the "u" flag for Unicode used to be used here, but was removed
-            // because it was (1) across-the-board too slow, and removing it
-            // made a statistically significant speed improvement, and (2)
-            // caused at least Chrome to have strange performance cliffs in
-            // unpredictable ways where certain regexp operations would take
-            // 10s of ms.
+            '(^|\\W)'
+                + escapeForRegExp(word)
+                + ((mode === 'autocomplete' && isLastWord) || mode === 'prefix' ? '' : '($|\\W)'),
+            //> The 'u' flag for Unicode used to be used here, but was removed
+            //  because it was (1) across-the-board too slow, and removing it
+            //  made a statistically significant speed improvement, and (2)
+            //  caused at least Chrome to have strange performance cliffs in
+            //  unpredictable ways where certain RegExp operations would take
+            //  10s of ms.
             caseSensitive ? 'mg' : 'img'
         );
-        return suggestions.filter(sugg => {
-            const text = by(sugg);
+        return results.filter(result => {
+            const text = by(result);
             const count = countMatches(text, regexp);
             if (count === 0) {
                 return false;
             }
-            //> TF-IDF weighting per-term
+            //> Compute the TF-IDF value for this `word`, and add it to this
+            //  result's TF-IDF value so far.
             tfidf.set(
-                sugg,
-                (tfidf.get(sugg) || 0)
-                    + (count / text.length * Math.log(items.length / suggestions.length))
+                result,
+                (tfidf.get(result) || 0)
+                    + (count / text.length * Math.log(items.length / results.length))
             );
             return true;
         })
     }, items);
 
-    return sortBy(suggestions, sugg => tfidf.get(sugg));
+    //> Sort the results list by our ranking metric, TF-IDF
+    return sortBy(results, result => tfidf.get(result));
 }