mv: ‘./input-file.zip’ and ‘./input-file.zip’ are the same file Creating study carrel named subject-spanishLanguage-gutenberg Initializing database Unzipping Archive: input-file.zip creating: ./tmp/input/input-file/ inflating: ./tmp/input/input-file/15353.txt inflating: ./tmp/input/input-file/15532.txt inflating: ./tmp/input/input-file/15127.txt inflating: ./tmp/input/input-file/11047.txt inflating: ./tmp/input/input-file/10814.txt inflating: ./tmp/input/input-file/41915.txt inflating: ./tmp/input/input-file/metadata.csv caution: excluded filename not matched: *MACOSX* === DIRECTORIES: ./tmp/input === DIRECTORY: ./tmp/input/input-file === metadata file: ./tmp/input/input-file/metadata.csv === found metadata file === updating bibliographic database Building study carrel named subject-spanishLanguage-gutenberg FILE: cache/15353.txt OUTPUT: txt/15353.txt FILE: cache/11047.txt OUTPUT: txt/11047.txt FILE: cache/10814.txt OUTPUT: txt/10814.txt FILE: cache/15532.txt OUTPUT: txt/15532.txt FILE: cache/41915.txt OUTPUT: txt/41915.txt FILE: cache/15127.txt OUTPUT: txt/15127.txt 11047 txt/../wrd/11047.wrd 11047 txt/../pos/11047.pos === file2bib.sh === id: 11047 author: Cyr, Ellen M. title: Libro segundo de lectura date: pages: extension: .txt txt: ./txt/11047.txt cache: ./cache/11047.txt Content-Encoding UTF-8 Content-Type text/plain; charset=UTF-8 X-Parsed-By ['org.apache.tika.parser.DefaultParser', 'org.apache.tika.parser.csv.TextAndCSVParser'] X-TIKA:content_handler ToTextContentHandler X-TIKA:embedded_depth 0 X-TIKA:parse_time_millis 3 resourceName b'11047.txt' 11047 txt/../ent/11047.ent 15353 txt/../wrd/15353.wrd 15353 txt/../pos/15353.pos 41915 txt/../wrd/41915.wrd 15532 txt/../pos/15532.pos 41915 txt/../pos/41915.pos 15532 txt/../wrd/15532.wrd 15127 txt/../wrd/15127.wrd 15127 txt/../pos/15127.pos 10814 txt/../pos/10814.pos 15353 txt/../ent/15353.ent 15127 txt/../ent/15127.ent 10814 txt/../wrd/10814.wrd 15532 txt/../ent/15532.ent === file2bib.sh === id: 15353 author: Roessler, Erwin W. (Erwin William) title: A First Spanish Reader date: pages: extension: .txt txt: ./txt/15353.txt cache: ./cache/15353.txt Content-Encoding UTF-8 Content-Type text/plain; charset=UTF-8 X-Parsed-By ['org.apache.tika.parser.DefaultParser', 'org.apache.tika.parser.csv.TextAndCSVParser'] X-TIKA:content_handler ToTextContentHandler X-TIKA:embedded_depth 0 X-TIKA:parse_time_millis 5 resourceName b'15353.txt' 41915 txt/../ent/41915.ent 10814 txt/../ent/10814.ent === file2bib.sh === id: 41915 author: Hossfeld, C. title: Hossfeld's Spanish Dialogues, and Idiomatic Phrases Indispensible for a Rapid Acquisition of the Spanish Language date: pages: extension: .txt txt: ./txt/41915.txt cache: ./cache/41915.txt Content-Encoding UTF-8 Content-Type text/plain; charset=UTF-8 X-Parsed-By ['org.apache.tika.parser.DefaultParser', 'org.apache.tika.parser.csv.TextAndCSVParser'] X-TIKA:content_handler ToTextContentHandler X-TIKA:embedded_depth 0 X-TIKA:parse_time_millis 10 resourceName b'41915.txt' === file2bib.sh === id: 15532 author: Alarcón, Pedro Antonio de title: Novelas Cortas date: pages: extension: .txt txt: ./txt/15532.txt cache: ./cache/15532.txt Content-Encoding UTF-8 Content-Type text/plain; charset=UTF-8 X-Parsed-By ['org.apache.tika.parser.DefaultParser', 'org.apache.tika.parser.csv.TextAndCSVParser'] X-TIKA:content_handler ToTextContentHandler X-TIKA:embedded_depth 0 X-TIKA:parse_time_millis 8 resourceName b'15532.txt' === file2bib.sh === id: 15127 author: Toledano, C. A. title: Pitman's Commercial Spanish Grammar (2nd ed.) date: pages: extension: .txt txt: ./txt/15127.txt cache: ./cache/15127.txt Content-Encoding UTF-8 Content-Type text/plain; charset=UTF-8 X-Parsed-By ['org.apache.tika.parser.DefaultParser', 'org.apache.tika.parser.csv.TextAndCSVParser'] X-TIKA:content_handler ToTextContentHandler X-TIKA:embedded_depth 0 X-TIKA:parse_time_millis 10 resourceName b'15127.txt' === file2bib.sh === id: 10814 author: Bécquer, Gustavo Adolfo title: Legends, Tales and Poems date: pages: extension: .txt txt: ./txt/10814.txt cache: ./cache/10814.txt Content-Encoding UTF-8 Content-Type text/plain; charset=UTF-8 X-Parsed-By ['org.apache.tika.parser.DefaultParser', 'org.apache.tika.parser.csv.TextAndCSVParser'] X-TIKA:content_handler ToTextContentHandler X-TIKA:embedded_depth 0 X-TIKA:parse_time_millis 9 resourceName b'10814.txt' Done mapping. Reducing subject-spanishLanguage-gutenberg === reduce.pl bib === id = 15532 author = Alarcón, Pedro Antonio de title = Novelas Cortas date = pages = extension = .txt mime = text/plain words = 70924 sentences = 16590 flesch = 87 summary = pasos adelante y uno atrás, que era como andaba en las 05 --Los ofrecidos hace días, en un bando, al que presente las ¿Sabes que todos los días roba, en distintos puntos de estas Una tarde, a eso de las seis, los ladrones que habían salido los muy mermados restos de sus alaveses; pero no sin que antes 20 del pueblo, mucho más anciana que el Pontífice: una viejecita --No, señor; pero, por las señas que me dió más tarde la estaba también cautivo, como todos los que no pudimos escaparnos las angustias del padre que va a casar una hija al día siguiente. --Por otro lado, tengo entendido[80-11] que de los tesoros hay aquella parte del mundo, y a las autoridades y mílites que los Cf. note _como que no_, p. 77-6: =por lo que=: cf. note _por lo que_, p. note _por lo que_, p. note _por lo que_, p. cache = ./cache/15532.txt txt = ./txt/15532.txt === reduce.pl bib === id = 15127 author = Toledano, C. A. title = Pitman's Commercial Spanish Grammar (2nd ed.) date = pages = extension = .txt mime = text/plain words = 86763 sentences = 16105 flesch = 83 summary = [Footnote 29: The object pronoun precedes the verb in the indicative 6. Es certísimo que los almacenes y las tiendas de esta calle disfrutan [Footnote 74: In sentences like "Le pagarán más que á mí" (they will pay Carecemos de noticias del vapor en que van los granos (carrying the Nos dicen los armadores que el cargamento llegará á esa el 15 del mes Los presupuestos, que tenemos recibidos del Trapiche para nuestro 8. Para no citar más que un ejemplo de la importancia de esta casa Son fabricantes ricos y al mismo tiempo generosos para con los que When an adverb is followed by a verb in English _que_ must be inserted como por lo acaudalados que son sus propietarios. 6. Estas son alfombradas de Bruselas que no las hay mejores en todo el Notice the following idiomatic uses of _Lo, La, Los, Las_ with the verbs =although=, aunque, por más que cache = ./cache/15127.txt txt = ./txt/15127.txt === reduce.pl bib === id = 11047 author = Cyr, Ellen M. title = Libro segundo de lectura date = pages = extension = .txt mime = text/plain words = 13734 sentences = 2621 flesch = 100 summary = Mamá dijo que era demasiado grande. Ella dijo que el recogedor serviría. Un día tomó una de las tazas de su Tenía azúcar para él todos los días. Tiene todos los días maíz para comer. A los pocos días brotaron las flores. Elena les echaba las migajas para que --Me gustaría que mamá lo viese,--dijo "My little papoose," said she. "What pretty white lilies!" said Lucy. --¡Oh, mamá!--dijo Carlos,--¡qué divertido es esto! "O mamma!" said Charles, "what fun They looked like little stars. "Some day you shall learn," said --Mira lo que te traigo,--dijo ella. --Sí, me dijo que los tenía para ti. "Buy a plant, little girl," said the que tenía una casa muy agradable. "I think it is very pretty," said "I'm a pretty bird," said the parrakeet; "I like the water, too!" said Paul. Ella tiene una amiga que se llama Luisa. Todos los días las cabras trepan por cache = ./cache/11047.txt txt = ./txt/11047.txt === reduce.pl bib === id = 15353 author = Roessler, Erwin W. (Erwin William) title = A First Spanish Reader date = pages = extension = .txt mime = text/plain words = 43496 sentences = 11106 flesch = 87 summary = Las mesas de los discípulos no son tan grandes como la mesa del maestro. significa por consiguiente todos los hijos y todas las hijas de la misma Al principio del verano los días son más largos y las noches más cortas. Por la noche, al referirle el portero los nombres de las personas que dijo:--¿Cómo no tiene esta grulla más que una pierna? Este país es más grande que todo el territorio de los Estados Unidos al --Miserable, me ha vendido Vd. Pero juro por todos los santos, que en llegar a ella tendrán que remontar los buques tres esclusas por una no me parecía eso posible, pero los hechos son más seguros que las --Con los negocios que acabas de hacer tienes una ganancia muy pingüe, 6. ¿Qué tiene que hacer el Barón todas las mañanas? =los=, they, them, you; =---que=, those who. cache = ./cache/15353.txt txt = ./txt/15353.txt === reduce.pl bib === id = 10814 author = Bécquer, Gustavo Adolfo title = Legends, Tales and Poems date = pages = extension = .txt mime = text/plain words = 105456 sentences = 14996 flesch = 82 summary = aún en los jirones del sudario, una vieja horrible, en la que conocí á bruja; y uno de los mozos, que con la una mano la había asido de las horrible al borde del derrumbadero, entre los que estaban allí para intervalos por entre los jirones de las nubes que volaban en derredor cumbre, dime, ¿has encontrado por acaso una mujer que vive entre sus las ondas del agua, parece que nos hablan los invisibles espíritus de murmullos del viento que agitaba las hojas de los árboles, comenzó á y perjura por todo lo más sagrado del mundo, los ciervos que discurren una manada, que á juzgar por las huellas debía componerse de más de Como á esta sazón notase don Dionís que entre unas y otras las horas nunca produce una impresión tan profunda como en los días en que las filas de los combatientes, que pasaban por debajo del estrado cache = ./cache/10814.txt txt = ./txt/10814.txt === reduce.pl bib === id = 41915 author = Hossfeld, C. title = Hossfeld's Spanish Dialogues, and Idiomatic Phrases Indispensible for a Rapid Acquisition of the Spanish Language date = pages = extension = .txt mime = text/plain words = 63721 sentences = 17039 flesch = 91 summary = English-Spanish Grammar, by Hossfeld's New Method, arranged for Classes, merchandise, goods |las mercancías, los géneros carriage, freight |el porte, los gastos de transporte goods |los géneros, las mercancías the walls of a town |los muros (las murallas) de una ciudad a water-bottle |una botella para agua runs along the |que pasa por los I think I shall go by it |Creo que otra vez lo |día o para una gentlemen; let us |que la comida está Sir, I wish you a good |Señor, deseo que pase Business called me |Tuve que volver para He has not been well |Hace una semana que returned a fortnight |una quincena que |Hace una hora que se marchó. I think I shall sleep |Creo que dormiré bien. Very good, Sir; will |Muy bien, Señor; sírvase books I wish to |de los libros que I like it better than |Me gusta más que el cache = ./cache/41915.txt txt = ./txt/41915.txt Building ./etc/reader.txt 10814 15127 15532 10814 15532 15353 number of items: 6 sum of words: 384,094 average size in words: 64,015 average readability score: 88 nouns: m.; |; p.; footnote; time; day; cf; sin; son; pres; =; adj; era; page; por; v.; refl; que; man; place; pero; one; verb; part; verses; form; words; syllable; como; pues; word; water; letter; verse; hay; más; house; way; vowels; order; hacer; night; vowel; verbs; nothing; con; name; subst; noun; note verbs: is; be; are; have; was; do; see; used; take; has; go; had; note; come; am; were; make; been; said; give; let; put; know; did; say; translate; want; think; following; does; que; get; speak; |; look; like; going; made; todo; set; found; fall; bring; ending; tell; being; become; wish; followed; show adjectives: |; little; good; other; same; está; spanish; first; old; last; great; many; past; small; more; such; much; sólo; present; sino; large; second; short; few; full; certain; beautiful; long; fine; able; young; strong; usted; own; possible; necessary; best; next; new; bad; different; la; dear; weak; general; cold; common; big; principal; free adverbs: not; very; so; up; out; here; also; well; only; now; as; too; much; then; there; more; down; however; away; back; never; most; always; often; even; soon; on; just; generally; instead; off; over; again; about; once; far; n''t; in; no; therefore; señor; quite; quiere; still; together; sometimes; rather; all; before; less pronouns: i; it; you; me; he; we; his; they; my; him; your; she; them; her; its; us; our; their; ya; oneself; one; himself; itself; themselves; myself; ourselves; yours; á; yourself; herself; mine; y; thee; ours; ha; momento; thy; |de; ví; theirs; ''s; |aquí; todo; je; cuanto; |salgo; |dime; |creo; yá; york= proper nouns: _; de; el; la; que; y; |; los; un; f.; las; se; á; ¿; una; del; por; su; al; con; v.; lo; en; es; qué; para; ¡; sus; le; como; más; yo; mi; .; muy; |la; -a; |el; cuando; había; as--; |una; tan; sobre; ni; esta; dos; entre; si; pero keywords: que; una; los; las; del; por; para; más; con; spanish; spain; señor; past; españa; word; time; tiene; sus; sin; san; present; pres; muy; mr.; madrid; juan; imperative; había; good; footnote; era; english; dios; def; day; como; |¿qué; |¿quiere; |¿hay; |¿cómo; |¿cuánto; |una; |un; |tengo; |sí; |si; |se; |no; |me; |los one topic; one dimension: la file(s): ./cache/10814.txt titles(s): Legends, Tales and Poems three topics; one dimension: la; el; ordeñar file(s): ./cache/10814.txt, ./cache/15127.txt, ./cache/11047.txt titles(s): Legends, Tales and Poems | Pitman''s Commercial Spanish Grammar (2nd ed.) | Libro segundo de lectura five topics; three dimensions: la el que; el la que; cumpleaños enseñado weeds; cumpleaños enseñado weeds; cumpleaños enseñado weeds file(s): ./cache/10814.txt, ./cache/41915.txt, ./cache/11047.txt, ./cache/11047.txt, ./cache/11047.txt titles(s): Legends, Tales and Poems | Hossfeld''s Spanish Dialogues, and Idiomatic Phrases Indispensible for a Rapid Acquisition of the Spanish Language | Libro segundo de lectura | Libro segundo de lectura | Libro segundo de lectura Type: gutenberg title: subject-spanishLanguage-gutenberg date: 2021-06-10 time: 13:06 username: emorgan patron: Eric Morgan email: emorgan@nd.edu input: facet_subject:"Spanish language" ==== make-pages.sh htm files ==== make-pages.sh complex files ==== make-pages.sh named enities ==== making bibliographics id: 15532 author: Alarcón, Pedro Antonio de title: Novelas Cortas date: words: 70924 sentences: 16590 pages: flesch: 87 cache: ./cache/15532.txt txt: ./txt/15532.txt summary: pasos adelante y uno atrás, que era como andaba en las 05 --Los ofrecidos hace días, en un bando, al que presente las ¿Sabes que todos los días roba, en distintos puntos de estas Una tarde, a eso de las seis, los ladrones que habían salido los muy mermados restos de sus alaveses; pero no sin que antes 20 del pueblo, mucho más anciana que el Pontífice: una viejecita --No, señor; pero, por las señas que me dió más tarde la estaba también cautivo, como todos los que no pudimos escaparnos las angustias del padre que va a casar una hija al día siguiente. --Por otro lado, tengo entendido[80-11] que de los tesoros hay aquella parte del mundo, y a las autoridades y mílites que los Cf. note _como que no_, p. 77-6: =por lo que=: cf. note _por lo que_, p. note _por lo que_, p. note _por lo que_, p. id: 10814 author: Bécquer, Gustavo Adolfo title: Legends, Tales and Poems date: words: 105456 sentences: 14996 pages: flesch: 82 cache: ./cache/10814.txt txt: ./txt/10814.txt summary: aún en los jirones del sudario, una vieja horrible, en la que conocí á bruja; y uno de los mozos, que con la una mano la había asido de las horrible al borde del derrumbadero, entre los que estaban allí para intervalos por entre los jirones de las nubes que volaban en derredor cumbre, dime, ¿has encontrado por acaso una mujer que vive entre sus las ondas del agua, parece que nos hablan los invisibles espíritus de murmullos del viento que agitaba las hojas de los árboles, comenzó á y perjura por todo lo más sagrado del mundo, los ciervos que discurren una manada, que á juzgar por las huellas debía componerse de más de Como á esta sazón notase don Dionís que entre unas y otras las horas nunca produce una impresión tan profunda como en los días en que las filas de los combatientes, que pasaban por debajo del estrado id: 11047 author: Cyr, Ellen M. title: Libro segundo de lectura date: words: 13734 sentences: 2621 pages: flesch: 100 cache: ./cache/11047.txt txt: ./txt/11047.txt summary: Mamá dijo que era demasiado grande. Ella dijo que el recogedor serviría. Un día tomó una de las tazas de su Tenía azúcar para él todos los días. Tiene todos los días maíz para comer. A los pocos días brotaron las flores. Elena les echaba las migajas para que --Me gustaría que mamá lo viese,--dijo "My little papoose," said she. "What pretty white lilies!" said Lucy. --¡Oh, mamá!--dijo Carlos,--¡qué divertido es esto! "O mamma!" said Charles, "what fun They looked like little stars. "Some day you shall learn," said --Mira lo que te traigo,--dijo ella. --Sí, me dijo que los tenía para ti. "Buy a plant, little girl," said the que tenía una casa muy agradable. "I think it is very pretty," said "I''m a pretty bird," said the parrakeet; "I like the water, too!" said Paul. Ella tiene una amiga que se llama Luisa. Todos los días las cabras trepan por id: 41915 author: Hossfeld, C. title: Hossfeld''s Spanish Dialogues, and Idiomatic Phrases Indispensible for a Rapid Acquisition of the Spanish Language date: words: 63721 sentences: 17039 pages: flesch: 91 cache: ./cache/41915.txt txt: ./txt/41915.txt summary: English-Spanish Grammar, by Hossfeld''s New Method, arranged for Classes, merchandise, goods |las mercancías, los géneros carriage, freight |el porte, los gastos de transporte goods |los géneros, las mercancías the walls of a town |los muros (las murallas) de una ciudad a water-bottle |una botella para agua runs along the |que pasa por los I think I shall go by it |Creo que otra vez lo |día o para una gentlemen; let us |que la comida está Sir, I wish you a good |Señor, deseo que pase Business called me |Tuve que volver para He has not been well |Hace una semana que returned a fortnight |una quincena que |Hace una hora que se marchó. I think I shall sleep |Creo que dormiré bien. Very good, Sir; will |Muy bien, Señor; sírvase books I wish to |de los libros que I like it better than |Me gusta más que el id: 15353 author: Roessler, Erwin W. (Erwin William) title: A First Spanish Reader date: words: 43496 sentences: 11106 pages: flesch: 87 cache: ./cache/15353.txt txt: ./txt/15353.txt summary: Las mesas de los discípulos no son tan grandes como la mesa del maestro. significa por consiguiente todos los hijos y todas las hijas de la misma Al principio del verano los días son más largos y las noches más cortas. Por la noche, al referirle el portero los nombres de las personas que dijo:--¿Cómo no tiene esta grulla más que una pierna? Este país es más grande que todo el territorio de los Estados Unidos al --Miserable, me ha vendido Vd. Pero juro por todos los santos, que en llegar a ella tendrán que remontar los buques tres esclusas por una no me parecía eso posible, pero los hechos son más seguros que las --Con los negocios que acabas de hacer tienes una ganancia muy pingüe, 6. ¿Qué tiene que hacer el Barón todas las mañanas? =los=, they, them, you; =---que=, those who. id: 15127 author: Toledano, C. A. title: Pitman''s Commercial Spanish Grammar (2nd ed.) date: words: 86763 sentences: 16105 pages: flesch: 83 cache: ./cache/15127.txt txt: ./txt/15127.txt summary: [Footnote 29: The object pronoun precedes the verb in the indicative 6. Es certísimo que los almacenes y las tiendas de esta calle disfrutan [Footnote 74: In sentences like "Le pagarán más que á mí" (they will pay Carecemos de noticias del vapor en que van los granos (carrying the Nos dicen los armadores que el cargamento llegará á esa el 15 del mes Los presupuestos, que tenemos recibidos del Trapiche para nuestro 8. Para no citar más que un ejemplo de la importancia de esta casa Son fabricantes ricos y al mismo tiempo generosos para con los que When an adverb is followed by a verb in English _que_ must be inserted como por lo acaudalados que son sus propietarios. 6. Estas son alfombradas de Bruselas que no las hay mejores en todo el Notice the following idiomatic uses of _Lo, La, Los, Las_ with the verbs =although=, aunque, por más que ==== make-pages.sh questions ==== make-pages.sh search ==== make-pages.sh topic modeling corpus Zipping study carrel