Лингвистический анализ: 100 волшебных сказок (Ганс Андерсен)


- 100 волшебных сказок (пер. Анна Васильевна Ганзен, ...) (а.с. Антология детской литературы -2015) 4.05 Мб, 1121с. скачать: (fb2) (исправленную)  читать: (полностью)  - Ганс Христиан Андерсен - Сергей Тимофеевич Аксаков - Всеволод Михайлович Гаршин - Карло Коллоди - Александр Иванович Куприн

Общая статистика

Длина текста2016643 знаков
Длина диалогов496581 знаков
Слов в произведении (СВП)326462 слов
Приблизительно страниц1121 стр.
Средняя длина слова4.88 знаков
Предложений в произведении (ПВП)20232 предл.
Средняя длина предложения (СДП)96.92 знаков
Доля диалогов в тексте24.62 %
Доля авторского текста75.38 %
СДП диалогов107.23 знаков
СДП авторского текста122.75 знаков
Использование диалогов по тексту книги № 298254: 100 волшебных сказок (Ганс Андерсен)
Максимальный фрагмент авторского текста - 223669 знаков (в страницах - примерно 124, начинается где-то с 686 страницы)

Активный словарный запас

Использовано уникальных слов40598
Активный словарный запас (АСЗ)39618
Активный не словарный запас (АНСЗ)980
Удельный АСЗ на 3000 слов текста1329.81281643 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста3407.62385103 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста18533.0665407 место в рейтинге УАСЗ-100000
Удельный АСЗ-3000 книги № 298254: 100 волшебных сказок (Ганс Андерсен)
Максимальный УАСЗ-3000 (1731) наблюдается примерно на 1105 странице
Минимальный УАСЗ-3000 (914) наблюдается примерно на 618 странице
Рост АСЗ книги № 298254: 100 волшебных сказок (Ганс Андерсен)

Буквы и знаки препинания

Всего букв1593496 букв
Всего знаков препинания68610 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 36567112.01
. 1670751.18
- 26838.22
? 21216.50
! 553216.95
... 00.00
!.. 880.27
?.. 280.09
!!! 00.00
?! 90.03
" 00.00
() 2010.62
: 27488.42
; 19265.90
БукваКол-во (шт.)Частота использования (в %)
А1352128.49
Б285281.79
В656254.12
Г294621.85
Д505673.17
Е-Ё1324338.31
Ж294621.85
З273931.72
И-Й1228137.71
К644804.05
Л876945.50
М493613.10
Н936645.88
О18019111.31
П432222.71
Р666394.18
С826465.19
Т943035.92
У492463.09
Ф16050.10
Х138150.87
Ц71170.45
Ч242781.52
Ш151390.95
Щ44040.28
Ь-Ъ348282.19
Ы306621.92
Э42550.27
Ю86570.54
Я298151.87
Диаграма использования букв книги № 298254: 100 волшебных сказок (Ганс Андерсен)

Части речи

Определенных частей речи (ОЧР)326184 слов
Не определенных частей речи (НОЧР)278 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.7672823.523
Глаг.3695119.657
Мест.-сущ.3695111.328
Предл.212829.966
Союз3485611
Прилаг.212826.525
Нареч.177815.451
Местоим-прилаг.169815.206
Частица148784.561
Местоим. нареч.67732.076
Числит.20720.635
Числит-прилаг.5630.173
Междомет.6890.211
Часть комп.
сложн. слова
50.002

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.33.8053.5718.3327.6349.0111.4811.8711.909.016.281.090.390.870.00
Глаг.35.2422.1428.8238.4223.0511.7912.0410.098.084.701.480.260.460.00
Мест.-сущ.14.8036.998.1910.858.626.299.764.899.103.010.600.070.120.00
Предл.50.281.1720.880.510.8310.780.3412.960.080.031.160.620.020.01
Союз17.5627.3817.688.524.605.677.905.697.793.280.560.170.060.00
Прилаг.42.954.191.442.026.025.390.850.800.960.440.110.030.050.00
Нареч.4.7319.524.714.785.693.544.611.553.880.990.400.020.090.00
Местоим-прилаг.24.086.583.622.461.836.811.821.452.140.650.530.070.030.00
Частица4.3319.705.883.012.681.793.011.832.111.010.210.020.030.00
Местоим. нареч.1.894.443.241.173.890.852.060.592.220.300.060.020.020.00
Числит.4.190.310.130.140.270.730.150.140.050.020.160.040.010.00
Числит-прилаг.1.040.210.070.130.060.050.050.020.060.010.010.010.000.00
Междомет.0.330.370.290.020.310.080.040.150.120.050.000.000.360.00
Часть комп.
сложн. слова
0.010.000.000.000.010.000.000.000.000.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.16.1819.2620.5723.1724.92
Глаг.9.7725.0426.4823.7321.65
Мест.-сущ.15.3816.6013.2412.1310.12
Предл.8.786.149.6110.4710.76
Союз19.875.886.567.859.51
Прилаг.3.704.325.156.266.90
Нареч.7.616.526.305.505.01
Местоим-прилаг.3.735.014.344.645.01
Частица6.757.795.393.743.61
Местоим. нареч.5.762.251.511.461.54
Числит.0.510.630.520.750.74
Числит-прилаг.0.200.290.190.210.14
Междомет.1.780.270.150.080.09
Часть комп.
сложн. слова
0.000.000.000.000.00

Номер слова в предложении
678910
Сущ.25.0824.2023.2423.2923.76
Глаг.20.3119.3520.5319.3518.66
Мест.-сущ.9.6810.319.8510.509.98
Предл.10.5610.1811.1910.9711.15
Союз11.4512.1611.0311.3711.51
Прилаг.6.907.097.037.187.25
Нареч.4.795.025.024.965.16
Местоим-прилаг.5.085.445.275.645.56
Частица3.493.734.003.914.15
Местоим. нареч.1.691.631.971.921.95
Числит.0.740.640.660.650.61
Числит-прилаг.0.180.180.150.180.16
Междомет.0.060.070.050.080.09
Часть комп.
сложн. слова
0.010.000.000.000.00

Номер слова в предложении
1112131415
Сущ.23.5622.7522.8822.8822.83
Глаг.18.9119.4118.7018.3219.07
Мест.-сущ.10.1310.4510.9110.6410.23
Предл.10.8510.8710.6511.1111.01
Союз12.2011.2910.7611.3011.29
Прилаг.7.197.397.237.007.26
Нареч.4.894.775.455.395.05
Местоим-прилаг.5.735.665.555.985.60
Частица4.134.394.734.474.63
Местоим. нареч.1.652.041.981.962.11
Числит.0.570.610.900.670.58
Числит-прилаг.0.090.200.160.110.23
Междомет.0.090.150.120.160.10
Часть комп.
сложн. слова
0.000.000.000.000.01