Грамотный граббинг инфы с ИМДБ + уникодовые шрифты

Описание: Вопросы, связанные с каталогизатором фильмов All My Movies
Модераторы: datasource, Автор

Krecheth
Пользователь
Krecheth
Пользователь
Репутация: 0
С нами: 18 лет 1 месяц

Сообщение #1 Krecheth » Вт февраля 14, 2006 4:45 pm

Приветствую!
хочу еще раз поблагодарить автора за замечательную программу.. Это первый софт, который я лично купил для себя :)

Вернусь к вопросу(-ам), который(-ые) обсуждал с тобой, Макс, в личной переписке.

1. Программа вытягивает не более двух режиссеров из базы ИМДБ (про другие базы молчу - просто не знаю, не работаю с ними), а у меня немало фильмов, где в режиссерах числятся три, а порой и более лиц (эдакие наборы новелл). Это и "Эрос" и "Три шага в бреду" и "На десять минут старше" и т.п. Очень и очень НЕОБХОДИМО правильное вытягивание служебной инфы о фильме.. Предлагаю грабить отсюда:
http://imdb.com/title/tt*******/fullcredits

2. В принципе схожая ситуация и с вытягиванием описательной части фильма. ИМДБ на основной страничке фильма предоставляет только урезанную часть описания. Полное же описание прячется на странице
http://imdb.com/title/tt*******/plotsummary. Хотелось бы, чтобы программа отсюда брала инфу.

3. я очень трепетно отношусь к людям, создающим кино, поэтому очень интересуюсь создателями. Отсутствие информации о сценаристе(-ах) - очень большой недостаток. Понимаю, что это влечет за собой небольшую реорганизацию базы (точнее добавление поля да правка существующих выборок), но надеюсь, что меня поддержат любители кино и автор в ближайшем будущем пойдет на этот шаг.

4. Ну и весьма нужная фича - поддержка юникодовых шрифтов. Ситуация простая - думаю, многие держат русские и заграничные фильмы в одной базе. При этом те, кто имеет в базе итальянские/испанские/французские/итп фильмы могли заметить, что происходит каверкание отдельных (специфических для тех языков) букв в фамилиях актеров, режиссеров, названиях фильмов. очень хочется видеть базу в полноценном виде.

5. Ну и уже по ходу родилось еще одно. Поддерживаю не_помню_кого, кто в соседнем топике предлагал оформить изъятие данных из баз в виде доп. окошка, в котором чекбоксами отмечать, что в данный момент тянуть, а что нет. В добавок к этому удобству хочется предложить такую фичу:
неанглоязычные фильмы ведутся в ИМДБ по оригинальному названию, т.е. на языке создателя. Я веду базу по оригинальным названиям и меня это устраивает в большинстве случаев, за исключением тех моментов, когда название совсем уж непроизносимо-незапоминаемое (как в случаях с азиатскими фильмами). В поле название у меня вводится русское название. Вот думаю, что каким-то образом стоило бы реализовать изъятие инфы из поля 'Also known as'. Если там даже несколько наименований, то обычно первым идет то, под которым фильм шел в мировом прокате или просто выходил на видео в США или Европе.
Извлечение этого поля влечет за собой опять же добавление нового поля в таблицу БД программы. Хотя может быть у кого-то появятся идеи, как можно реализовать, не мучаясь с реорганизацие структуры БД (например, автоматом добавлять в поле 'название', а я сам бы уже через дробь прописывал еще и русское название.. но это, конечно, грустный вариант)
Вкачестве примера возьмем КарВаевское "Любовное Настроение" (http://imdb.com/title/tt0118694/).
оригинальное название - Fa yeung nin wa
интернациональное название - In the Mood for Love
название - Любовное настроение

сортировать или выводить отдельным столбцом это поле в программе нужды нет, но вот каким-либо образом отображать возле Оригинального названия. пожалуй, было бы очень полезно.

6. Оптимизация поиска по названию. Для быстрого поиска по названию хотелось бы, чтобы, не включаа форму поиска, можно было бы просто в списке всех фильмов ввести первые буквы и курсор автоматом перебегал на соответствующие названия (сейчас прога ведется только на первую букву).

Вот такие пожелания и просьбы. Очень хочется живого обсуждения больных тем и проблем программы, ну и, соответственно, авторской поддержки и реализации полезных и необходимых (по моему скромному мнению) фич и прибамбасов, доведущих программу до вершин юзабилити, полезности и своершенства :)

Krecheth
Пользователь
Krecheth
Пользователь
Репутация: 0
С нами: 18 лет 1 месяц

Сообщение #2 Krecheth » Вт февраля 14, 2006 4:55 pm

вопросы 1, 2, 3 считаю первостепенными
5, 6 - значительным повышением удобства
4 - зажравшимся требованиям синефила :)

aJex Lion
Опытный пользователь
aJex Lion
Опытный пользователь
Репутация: 0
С нами: 18 лет 1 месяц
Откуда: Мос область

Сообщение #3 aJex Lion » Ср февраля 15, 2006 9:08 am

Уважаемый Krecheth
Не думаю, что ты правильно поступил, создав отдельную тему про "добавки" для AMM, но тем не менее...
Поддерживаю тебя полностью по поводу кодировок. У меня в базе фильмы как русские так и "забугорные", так вот проблема кодировки особенно заметна во французких и итальянских фильмах. ( Perбs или Sophiб и тк далее) вывод - надо что-то думать, хотя я и сам программер, но с этим раньше не встречался и поэтому предложить выход не могу - просто констатирую.
Об остальных прадложениях не связанных с кодировкой выскажусь в топике "вопросов-предложений"...

Krecheth
Пользователь
Krecheth
Пользователь
Репутация: 0
С нами: 18 лет 1 месяц

Сообщение #4 Krecheth » Ср февраля 15, 2006 11:46 am

aJex Lion писал(а):Уважаемый Krecheth
Не думаю, что ты правильно поступил, создав отдельную тему про "добавки" для AMM, но тем не менее...

к сожалению, та ветка захламлена цитатами - ответами - запросами.. очень сложно будет читать и понимать.. через месц там будет 20 страниц и врдя ли новички захотят читать с первой страницы, поэтому и предлагаю каким-либо образом разделять темы. А чтоб мои запросы были на виду в том топике буду периодически кидать линк :)


Вернуться в «All My Movies»

Кто сейчас на форуме (по активности за 5 минут)

Сейчас этот раздел просматривают: 82 гостя