План развития Лексиконов

Главная > Будущее Лексиконов
Праязыки: А | Б | В | Г | Д | Е | Ж | З | И | Й | К | Л | М | Н | О | П | С | Т | У | Ф | Х | Ц | Ч | Э | Ю | Я
Древние языки: А | Б | В | Г | Д | Е | З | И | К | Л | М | Н | О | П | Р | С | Т | У | Ф | Х | Ц | Ч | Ш | Э | Ю | Я
Вымершие языки: А | Б | В | Г | Д | Е | Ж | З | И | Й | К | Л | М | Н | О | П | Р | С | Т | У | Ф | Х | Ц | Ч | Ш | Э | Ю | Я
Современные языки на: А | Б | В | Г | Д | Е | Ж | З | И | Й | К | Л | М | Н | О | П | Р | С | Т | У | Ф | Х | Ц | Ч | Ш | Э | Ю | Я
Модельные языки: А | Б | В | Г | Д | Е | Ж | З | И | Й | К | Л | М | Н | О | П | Р | С | Т | У | Ф | Х | Ц | Ч | Ш | Э | Ю | Я
Калейдоскоп языковых систем

Разделы страницы о развитии этого и всех родственных словарных сайтов:

  • Общие работы
  • В ближайших планах (на очереди)
  • В дальнейших планах
  • Планы по другим работам на Лексиконах
  • Планы на родственных словарных проектах
  • Планы по выводу ряда словарей в отдельные языковые сайты

Кроме того - устранение недоделок в новых лексиконах. Там же - о прошедших экспериментальных работах, которые потом будут произведены над всеми словарными сайтами.


Общие работы

Планируемые усовершенствования по большинству или части страниц Лексиконов.

  1. Положить на словарные страницы алфавитные ASCII-секции
  2. Реестр языков (максимальный, с кратким обзором и ссылками по каждому) - за основу взять каталог языков на Этнологе
  3. Дополнить краткие этнологические языковые обзоры статьями из Лингвистической энциклопедии Ярцевой
  4. Снабдить современные словари ссылками на англоязычные онлайн-словари сайта Вавилон

В ближайших планах (на очереди)

Кроме того, во все имеющиеся и будущие русско-иностранные словари поставить побуквенные ссылки на русские толковые и этимологические словари по примерно следующей схеме: 1) для древних и праязыков - на Ожегова (лучше потом - на более классического Ушакова) и Семёнова (там в первой строке - праформы) или краткого Шанского (он лучше школьного и тоже с праформами) или потом Преображенского (там - праиндоевропейские формы), 2) для модельных и угасших - на Ожегова (для славянских - на Даля) и школьного Шанского (или Семенова) , 3) для современных - на Ожегова (для славянских - на Даля) и Цыганенко (для неславянских - на Крылова) .

Доделать

Современные словники из интегрального (частотного) Excel

В  основном, это европейские языки - германские, романские, славянские. Кроме того, финский.

  1. Словники чешского (со словацким)
  2. Словники словацкого (с чешским)
  3. Словники сербского (с хорватским)
  4. Подготовить Excel для китайского словаря.

Неоконченная обработка и добавление словарей модлангов

  1. Найти и добавить лексику полуязыка европеано (Латине-сине-флексионе/Интерлингва Пеано); ПЕРЕВЕСТИ описание на английском.
  2. Разделить интерлингву и окциденталь.
  3. Обработать и добавить словари новиаля (обработать и перевести уже буквенные новиаль-Eng-Deu словари), ЛФН (лингва-франка-нова - элэфэн) и лидепла (преобразовать и перевести англо-лдп-новиаль-другие таблицы).

Неоконченная обработка и добавление других словарей

  1. ! Добавить словники креола ток-писин (как сермяжного английского)
  2. Добавить словари хауса-английского из pdf
  3. ! Не полная русская лексика в русско-латинском (на С и др.)
  4. Подготовить русский словник сорбского (на основе лужицко-русского)
  5. Подготовить суахили-русский (на основе русско-суахильского) [но это - большой объём]
  6. Перевести словник аборигенного яралнга
  7. Подготовить русский словник питта-питта (на основе питта-английского)

Древние языки и праязыки

Праязыков вообще почти что нет - это большая дыра в Лексиконах, целая ветка пустая. Также не хватает важных древних языков, нужных дешифровщикам и компартивистам.

  1. ! Другие этимологические словари Старостина по праязыкам и древним языкам (индоевропейские, ностратические, афразийские...)
  2. Добавить словники палеобалканских и палеоевропейских языков (венетский, мессапский...)

Узловые работы

Приоритеты ("узлы"):

  1. рапануйский (перевести) и полинезийские (+ общеполинезийский свод) - для дешифровки кохау ронго-ронго и моделирования общеполинезийского языка
  2. иврит с семитскими и прасемитским (корнеслов, перевод, связь, транскрипция) - для дешифровки протобиблского письма
  3. ! этрусский лексикон (объединить все словари) - для семантической дешифровки этрусского языка
  4. ! эсперанто и конланги - для реформы эсперанто и создания Семантической модели (СМ)
  5. английский + ток-писин + бэйсик-инглиш также для создания Семантической Модели
  6. латинский (!дополнить и обработать) с романскими - как основа интернациональной лексики и многих всемирных языковых проектов
  7. древнегреческий (!обработать, разложить) - как основа интернациональной лексики и для дешифровки критских письменностей
  8. церковно-славянский (обработать 4-томник) - для праславянской этимологии и моделирования общеславянского языка
  9. прусский (!обработать, доложить) с ятвяжским (перевести) - для возможного восстановления прусской речи и также для праславянской этимологии
  10. татарский (осталось разделить) с другими тюркскими и древнетюркским - для ортатюркского моделирования

I. Рапануйский узел

Лексика для расшифровки кохау-ронгоронго - неразгаданной письменности острова Пасхи.

  1. ! Перевести рапануйско-английский словарь и сделать обратный.
  2. Добавить лексику и форманты таитянского и маорийского.
  3. На основе рапануйско-английского, русско-таитянского и маори-русского сделать общеполинезийский лексикон (для дешифровки письма ронго)
  4. Перевести англо-кечуанский и соединить его с инга-русским. Это нужно для сравнения с рапануйским и возможного перевода ронго.

Объединённые сведения по грамматике и лексике полинезийских языков, необходимые при расшифровке "говорящих дощечек" составят общеполинезийский свод и послужат основой для моделирования нового общеполинезийского языка.

II. Семитский узел

Лексика, необходимая для дешифровки протобиблского письма - слогового предшественника консонантных семитских алфавитов и праотца всех современных алфавитов.

Что нужно сделать для этого:

  1. ! разместить корнеслов древнего иврита (древнееврейского языка)
  2. ! разместить богатый древнеегипетский свод
  3. ! разместить праафразийский этимологический словарь (и перелинковать с ностратическим)
  4. возможно, разместить словарь древнего арамейского языка
  5. возможно, разместить аккадский лексикон
  6. перелинковать между собой иврит, арабский, прасемитский, праафразийский (и другие афразийские - аккадский, египетский...)

На основе семитского корнеслова можно усовершенствовать вышеназванную Семантическую модель, а также разработать общеафразийский языковый проект.

В дальнейших планах

Памирские языки из книг

  1. ! Словарь гиссарских парья (связать с санскритом, а потом с хинди)
  2. Ваханский лексикон (потом связать с осетинским, фарси, авестийским)
  3. Сарыкольский лексикон (потом связать с ваханским)

Другие лексиконы

  1. ►Лексиконы древних литературных языков - источников интернациональной лексики: древнегреческого (положить и отредактировать), латинского (объединить ложные омонимы), старославянского (и связь с праславянским).
  2. ►Обобщённый этрусский лексикон [для дешифровки этрусского языка].
  3. ►Обобщённый прусский лексикон (пока буква A) - для уточнения праславянского языка (переложить заново или поправить).
  4. ►Лексиконы праязыков из этимологических баз С.А.Старостина.
  5. Лексиконы важнейших современных языков: китайского, японского, хинди, бенгали, фарси, турецкого, немецкого [осталось поправить?], французского, испанского, итальянского, португальского (и связь романских с латинским), новогреческого (и его связь с древнегреческим). Затем - вторая двадцатка мировых языков: 1) телугу, тамил; 2) корейский; 3) яванский; 4) вьетнамский; 5) маратхи, урду. Затем третью.
  6. Лексиконы самых развитых современных тюркских языков (+татарского, казахского, узбекского) [для разработки общетюркского языка].
  7. Лексиконы важных для науки изолированных языков, в т.ч. исчезнувшего айнского языка.
  8. Лексиконы важнейших для интерлингвистики модельных полуязыков (плановых языков успешного применения): идо, интерлингва, окциденталь, новиаль, латине-сине-флексионе, глосса [для реформы эсперанто и разработки всеобщего языка]. А также разделить элементарные корни Логлана по алфавиту и частям речи (выделить страницы).

Планы по другим работам на Лексиконах

Семантическая унификация

  1. ! Разработать Семантический Шаблон (СШ) для создания и правки словарей (для начала на 1000-2000 слов)
  2. На основе СШ подготовить лексиконы:
    1. славянских языков: сербско-хорватского, польского, чешского и др. (и купить словенский словарь)
    2. татарский лексикон (потом - казахский, узбекский и турецкий)
    3. древнетюркский лексикон (потом пратюркский)
    4. японский лексикон (потом корейский, связать оба между собой и китаизмами с китайским)
    5. вьетнамский лексикон (связать китаизмами с китайским)
    6. хинди и фарси лексиконы (связать с санскритом)
    7. другие важные лексиконы (армянский, грузинский, кабардинский, чеченский; аранда; аймара, оджибве; фульбе, зулу, баскский, кхмерский, тайский, тибетский, бирманский...)
  3. Разработать единую Семантическую Модель (СМ)
  4. На основе СМ разработать единую структуру БД (чтобы нанизать всю лексику на единый семантический стержень)

Оживление статического сайта

Прежде всего - наполнение сайта онлайн-сервисами:

  1. Перевод словарей в базу данных (mySQL) и выборка из базы.
  2. Выборка слов и значений из словарей по различным критериям (через форму поиска).
  3. Сравнение слов и значений из разных словарей (тоже через особую форму) [для реконструкции праязыков и дешифровки письменностей].
  4. Кроме русско-иностраннных и иностранно-русских словарей иметь англоязычные версии.
  5. Дополнить словарями в других форматах, прежде всего - для Lingvo.
  6. Дополнить слова национальным написанием.

Планы на родственных словарных проектах

В  отдельные проекты выделены лексиконы некоторых праязыков (причем там не только этимологические словари, а полное описание праязыков) и исследование русского языка - в первую очередь, его лексики.

Состояние родственных сайтов в показателях

Развитие родительского универсального сайта garshin.ru и дочерних словарных сайтов отражено в следующей статистике:

Сайт.ru,
htm* в
sitemap
Объективные внутренние факторы Привлекательность для акцепторов Поведенческие факторы
Кол-во страниц
(в индексе / загружено)
Объём (html+htm
/ Мбайт)
Ист-
ки,%
поиск
закл.
сайт
Произ-
води-
тель-
ность
Доноров
(доменов
/ссылок)
Индексы цитируемости, в т.ч. интегральные
(популярность у сайтов)
Ссы-
лоч-
ный
спам
SR ПИК
m@
Попул-сть
у юзеров (в
сут. за мес)
Alexa Отказы, % Расшире-
ние ау-
дитории
Гугл
(URL)
Гугл
(XML)
Яндекс Мэйл Бинг Сапа html
+htm
pdf
+djv
Все Alx Goo тИЦ PR DL BL TF CF Rank* PCR SAR XT Визи-
тёров
Ви-
зитов
Global Local Alx Sim Mail MobEng
Дата: 11.02.16 08.02.16 09.02.16 14.02.16 14.02 01.02.16 01.02.2016 07.03 (регулярно) 12.06 14.02
Garshin
2605
2960
↗4445
2134
:2554
=84%
4197
:4748
=88%
3284
:3425
=96%
6820 3827 2303
+676
=2980
181
+0
=181
14163
/ 805
86
11
2
56 119 929 /
21407
450
↘230
↗250
4 50
↗60
275
↗288
23
↘22
27
↘26
1,09 82 3
↗4
7
↗9
16,7 54000
↘30000
37 2400
-3500
3400
-3900
↘172,128
275,347
↘9,902
↗29,418
↘43
↗49
65 84
80
Уд. Бы-
ло
Slovorod
467
↗720
↘649
873
:904
=97%
580
:686
=84%
605
:654
=92%
1500 754 219
+488
=707
68
+18
=86
809
/ 94
80
19
1
59 18 97 /
2273
20
↗50
2 3
↗4
6
↗7
0 16
↗17
0 39 2 7 2,8 27000
↘16000
27 1250
↗1370
2600
↘2000
↘315,570
↗686,354
547,124
↘19,254
↗84,539
↘47.624
10
↗31
56 74 Уд. -
Lexicons
1837
↗2110
↘2047
3568
:3678
=97%
2027
:2117
=96%
872
:1564
=56%
3380 2276 1597
+642
=2239
62
+11
=73
4708
/ 107
74
16
8
? 11 68 /
1378
20 2 2
↗3
2
↗4
0 15
↗17
0 40 2 6
↘5
3,5 3600
↘2100
2 100
↗140
300
↗360
↗296,422
705,744
↘17,606
↗123,186
31
↘25
41 74 Уд. +
Proto-Slavic
83
↗196
↘182
44
:49
=90%
118
:168
=70%
114
:158
=72%
551 129 22
+1
=23
32
+0?
=32
268
/ 12
59
24
18
59 8 56 /
315
0 2 1
↗2
1
↗2
0 ↘0
↗14
0 24
↗25
1 5
3
3,9 800
↘700
0 31
↗43
69
↗92
↘496,601
1,814,612
↘27,724
↗132,233
↗42
37
_ 57 Уд. -
Proto-IE
167
↗213
↘190
163
:166
=98%
212
:235
=90%
179
:233
=77%
499 190 89
+97
=186
56
+0
=56
326
/ 18
53
29
16
54 7 33 /
205
10 2
↘1
0
↗1
0
↗1
3
↗4
13
↗14
0 35 1
↗2
3 1,4 800
↘600
0 23
↗40
54
↗101
↘820,249
2,069,265
55,295
↗_
↗79
↘50
_ 51 Уд. -
Proto-Nos
29
↗146
↘143
29:29
=100%
135
:157
=86%
80
:139
=58%
283 113 106
+3
=109
45
+0
=45
290
/ 89
75
0
25
59 7 33 /
377
0 2 1 1 0 13
↗14
0 22
↗24
1
↗2
3 0 :) 300
↘100
0 13
↔ 44
36
↔ 74
↘858,093
3,143,154
55,661
↗_
83
↘69
_ 100 Уд. -

По всем сайтам: скачано страниц 6286; страниц в индексе 5134; обратных ссылок 74320 (01.03.2016).

Краткий обзор некоторых малоизвестных индексов цитируемости и других рангов (с величинами для Garshin.Ru на 13.01.2016):

Показатели привлекательности сайтов для пользователей (включая поведенческие факторы):

Показатели "веса" сайтов в глазах акцепторов - других сайтов, ставящих к себе ссылки на них (включая партнёров по обмену ссылками), а также реламодателей, которые хотели бы купить рекламное место для своих ссылок (что напрямую влияет на монетизацию):

  1. тИЦ - индекс цитируемости Яндекса: 300.
  2. PR (PageRank) - индекс цитируемости Google: 4 (из 10).
  3. DL (DomainLinks?) - якобы кол-во уникальных ссылающихся доменов: 57.
  4. BL (BackLinks?) - якобы общее кол-во ссылающихся страниц: 314 → 275 → 190.
  5. TF (Trust Flow) - уровень качества ссылающихся сайтов: 24 (из 100) [вот это - интересный параметр].
  6. CF (Citation Flow) - уровень цитируемости сайта (нормированный PR): 26 [из 100?].
  7. PCR - интегрированный индекс sites.PR-CY.ru (по предыдущим 4-рём?): 82 [из 100?].
  8. SAR - интегральный индекс Site Auditor: 4 (из 10) [мало отличается от PR].
  9. XT - трастовый индекс Яндекса, расчитываемый сервисом Xtool.ru: 5-7-9 (из 10). Больше 7 - трастовый (качеству и содержанию которого можно доверять) сайт. Меньше 3 - как у ГС.
  10. Коэффициент заспамленности сайта согласно сервису XTools (рекомендуется, чтобы заспамленность доноров была не выше нормы - т.е., < 2): 1) еньше 1 - заспамленность отсутсвует; 2) меньше 2 - можно сказать норма; 3) 2-4 - небольшая заспамленность; 4) 4-7 - средняя заспамленность; 5) 7-15 - сильная; 6) больше - очень сильный ссылочный спам.
  11. SR (SapeRang) - популярность? у рекламодателей в партнёрке Sape: 51,000.
  12. Разрезы MozRank от партнёрки MainLink (коррелирует с тИЦ и PR и скоро появится в таблице): Moz DA (Moz Domain Authority) - авторитетность домена [MozDA, MD=37]; Moz PA (Moz Page Authority) - авторитетность страницы (реально - авторитетность главной страницы) [MozPa, MP=45]; Moz Root Domains - кол-во корневых доменов второго уровня, ссылающихся на ресурс [MozRD, MR=36]; Moz Inbound Links - кол-во всех входящих ссылок на ресурс [MozIL, MI=4552].

Для того, чтобы дать оценку рейтинга любого ресурса, можно пользоваться следующей формулой: Rank* = (TF – CF) / (TF + CF + 1) + TF/(CF + 1) + TF/100. Rank* < 0.3 свидетельствует о низком качестве ресурса. [Если TF=0, то Rank при любом CF будет 0]

Для Garshin.Ru это будет: -2/51 + 24/27 + 0,24 = 1,09.

Есть также другие ранги:

А также прекрасная статистика на SemRush, траст и много других полезных показателей на SBUp и и другие метрики экспресс-анализа на Design-Sites.Ru.

А вот эти относительные показатели "дыр" также хотелось бы иметь:

Планы по сайту Proto-Nostratic.Ru (Ностратический праязык)

Сайт о ностратическом праязыке и его колыбели, откуда произошли праафразийский, праиндоевропейский, праалтайский, прауральский, прадравидский, пракартвельский и другие праязыки-потомки.

  1. ►Положить и порезать словарь Старостина (по Долгопольскому).
  2. ►Отредактировать страницы со словарём Долгопольского.
  3. ►Перевести на русский язык словарь Долгопольского.
  4. Сформировать русско-ностратические страницы.
  5. Написать транскрипцию ностратических лексем.
  6. Связать праностратические слова с праиндоевропейскими.
  7. Создать по каждой лексеме отдельную страницу.
  8. Связать ностратические лексемы с лексемами других праязыков-потомков (прежде всего - праафразийского и праалтайского).

Планы по сайту Proto-Indo-European.Ru (Индоевропейский праязык)

Сайт об индоевропейском праязыке и прародине индоевропейцев - предков ариев, балтов, германцев, греков, иллирийцев, италиков, кельтов, славян, фракийцев...

  1. ►Создать единый список корней (на основе Ватсона). Обработать его на основе Ватсон.дока
  2. ►Порезать на корни словарь Покорного.
  3. Связать праиндоевропейские корни с праностратическими и праславянскими.
  4. Связать с санскритом и древними языками-потомками (старославянский, латинский, прусский, древнегреческий, авестийский).

Планы по сайту Proto-Slavic.Ru (Праславянский язык)

Сайт о славянском праязыке и славянской прародине.

  1. ►Разместить и отредактировать ЭССЯ Трубачёва (в форме HTML).
  2. Найти источник словаря Покровского/Покорного? Добавить его слова в общий PSL-список и SLOV/slavic-words.
  3. Славянские лексемы (русского фонда) - жирным шрифтом (как в Б); потом перевести в Slovorod, а оттуда - корни.
  4. Выявить и добавить праславянский корнеслов и аффиксы [сначала из Словорода].
  5. Связать праславянские корни с праиндоевропейскими и праностратическими.
  6. Выделить праславянский корень на страницу-карточку с примерами производных слов из славянских языков. Затем - выбор лучших вариантов для общеславянской унификации и панславянского языка.

Планы по сайту Slovorod.Ru (Русская языковая система)

Сайт Словород посвящён исследованию русского языка и его сравнению с другими славянскими языками с целью усовершенствования на родной славянской основе. В первую очередь исследуется этимология слов и словообразовательный механизм. Затем будет исследоваться качество грамматической системы.

  1. ►Разместить словарь Фасмера, разделив его на славянскую и заимствованную лексику
  2. Дополнить из других этимологических словарей: Семёнова, Шанского, Черных, Шимкевича...
  3. ►Разместить СРНГ.
  4. ►Поправить зелень у Даля и нарезать его.
  5. Связать славянскую лексику с праславянскими, индоевропейскими и ностратическими корнями.
  6. Для заимствованных слов привести эквиваленты из славянских языков; затем предложить свои славянские варианты и оценить всё
  7. Доработать постфиксальную классификацию слов русского языка.
  8. ►Разместить морфологический словарь Тихонова.
  9. Снабдить старые слова старокирилличесим (и глаголическим) написанием.
  10. Выявить и показать бреши в парадигматике, трудности в изучении русского языка иностранцами. Предложить модели для закрытия брешей и объяснения трудностей.

Планы по выводу ряда словарей в отдельные языковые сайты

  1. Универсальная семантика и словообразование
  2. Панславянский язык и общеславянский фонд славянских языков (или сделать на базе праславянского?)
  3. Латинский язык (с италийскими); преобразования в романских (+ реформированные латыни?)
  4. Древнетюркский с ортатюркским
  5. Греческий язык (с древнегреческим, новогреческим и древнемакедонским фондами)
  6. Санскрит (и здесь же - пали?)
  7. Персидский язык: древнеперсидский (и авестийский?), среднеперсидский, современный фарси с диалектами
  8. Арабский язык (коранический и диалекты)
  9. Афразийский праязык (с прасемитским)
  10. Австронезийский праязык (с праокеанийским и праполинезийским?)
  11. Прабанту с панбанту
  12. Китайский язык (путунхуа, древнекитайский и диалекты)
  13. Японский язык

Словари в наличии | Новопоступившие | В планах | Лингвосервисы
Крупнейшие языки | Исчезающие языки | Онлайн-переводчики | Веб-сборники словарей

© «Lexicons.ru», Игорь Константинович Гаршин, 2012. Пишите письма (Письмо Игорю Константиновичу Гаршину).
Страница обновлена 25.05.2017
Метрика