[Logo]
LUA Форум
  [Search] Поиск   [Recent Topics] Последние темы   [Hottest Topics] Горячие темы   [Members]  Список участников   [Groups] На главную страницу 
[Register] Регистрация / 
[Login] Вход 
Парсинг gismeteo.ru  XML
Индекс форума » LUA: Общие вопросы
Автор Сообщение
al
ГУРУ
[Avatar]

Зарегистрирован: 04/02/2008 20:12:56
Сообщений: 127
От: Poltava, Ukraine
Оффлайн

theelephant wrote:переписываю парсер погоды с бота.... беру страницы типо http://informer.gismeteo.ru/rss/27715.xml

толкового мана по регулярным нету :(
пробывал ".-<item>.-<title>(.-)</title>.-<description>.-</description>.-</item>.-"


Надеюсь нижеприведенный код покажет красоту Lua:



XML.lua (http://dev.alt.textdrive.com/browser/HTTP/XML.lua)

индекс ['$'] - данные внутри тега, остальное должно быть понятно из кода
[Email] [ICQ]
torantbor
Новичок

Зарегистрирован: 15/01/2008 01:07:46
Сообщений: 29
От: Samara
Оффлайн

Надеюсь нижеприведенный код покажет красоту Lua:


А возможно ли тоже самое для HTML страницы? Просто я пробовал, не получилось :(

Если есть чем поделиться, то парсить можно, скажем, эту страницу:
http://www.lua.ru/page/list.html

Хотелось бы, чтобы можно было так же обращаться:
print(anHTML['html']['head']['title'])
al
ГУРУ
[Avatar]

Зарегистрирован: 04/02/2008 20:12:56
Сообщений: 127
От: Poltava, Ukraine
Оффлайн

torantbor wrote:Хрум


А возможно ли тоже самое для HTML страницы? Просто я пробовал, не получилось :(

Если есть чем поделиться, то парсить можно, скажем, эту страницу:
http://www.lua.ru/page/list.html

Хотелось бы, чтобы можно было так же обращаться:
print(anHTML['html']['head']['title'])


Конечно!
Так в чем проблема!


Правда есть два условия:

1. Документ должен быть строго XHTML
2. Все скрипты должны подключаться внешними
2а. Если в встроенном в код странице скрипте найдеться < или > то парсер остановиться....
[Email] [ICQ]
torantbor
Новичок

Зарегистрирован: 15/01/2008 01:07:46
Сообщений: 29
От: Samara
Оффлайн

Понятно, спасибо.
 
Индекс форума » LUA: Общие вопросы
Перейти:   
Powered by JForum 2.1.8 © JForum Team