![]() |
Как или чем можно граббить новости с сайта?
Помогите, пожалуйста с таким вопросом. Есть сайты, на которых регулярно выкладываются новости (сайты различных министерств). Нужно эти новости с них забирать и складывать в простой текстовый файл, ну например вордовский. Чем можно решить эту задачу? У меня просто вообще нет никакого опыта, не знаю даже с какой стороны подступиться.
|
Цитата:
Со вторым замучаетесь. |
Подскажите хоть как-нибудь, хоть в Блокнот, хоть в куда, я не привередничаю.
|
dislike, ну у самих сайтов наверное есть RSS? Есть программы для чтения RSS наподобии RSSOwl, в большенстве програм есть возможность сохранять новости, ну а про автоматизацию вы ничего не написали, значит не нужна...
|
Цитата:
Для RSS ставил FeedDemon, естественно никакой автоматизации в нём не нашел. Даже тупо экспорта в ворд нет (зато в Эксель есть :biggrin: ) |
php + vbs
|
dislike, При всем моем, сейчас ваша хотелка выглядит как просьба найти кнопку "Сделать зашибись!".
Сайты "различных" министерств работают кто на чем и как только не выкладывают информацию. Поэтому пока они абстрактно "различные", то разговор получается не о чем. Пишите конкретные сайты, и что во что складывать. Плюс желательно опыт пользователей и их способность решать офисные задачи (например "открыть файл с помощью") |
Я не специально, я правда не знаю на какой козе подъехать к этой задаче. Всё что мне удавалось найти, сводилось к граббингу информации с одного сайта сразу на свой сайт, соответственно требуется 1) иметь свой сайт 2) встраивать в него код граббера, а это ну совершенно не то, что хочется.
Сайт для примера такой: agro.tatarstan.ru Цитата:
|
dislike, вариантов масса. Всё зависит от того, что на самом деле Вам нужно, в каком именно виде. С какой периодичностью делать запросы. Надо ли отслеживать состояние, дабы не было дублирования информации при запросах. И т.д.
В общем виде это может быть любое средство, умеющее работать с xml. LogParser
Код:
"C:\Program Files (x86)\Log Parser 2.2\LogParser.exe" "SELECT title, link, description, pubDate, yandex:full-text INTO DATAGRID FROM 'http://agro.tatarstan.ru/rss/agro.xml#/rss/channel/item'" -i:XML -fMode:Tree ![]() Можно, разумеется, делать вывод не токмо в Grid, но и в текстовый документ, и в CSV. VBScript
Код:
Option Explicit ![]() Точно так же это может быть PowerShell, AutoIt, VB/VBA/VB.net, всяческие С/С++ и т.п. В любом случае, мне лично ни текстовый документ, ни Word в качестве основы вывода не нравятся. Жду Вашего ответа на вопросы. |
Цитата:
Цитата:
Цитата:
|
Цитата:
Так что они хотят с этим документом Word потом делать? Мне нужно понять — глобальная цель их какова? Я пока этого понять не могу, особенно учитывая: Цитата:
Цитата:
|
Цитата:
Если нужно, пример Цитата:
с каждого прилетит по 5 новостей, в каждой новости окажется по 5 картинок. Всё это запихнуть в один файл? Как минимум ему нужно будет четкое разделение, с какого сайта что прилетело. |
Цитата:
Цитата:
Цитата:
Цитата:
|
Время: 22:42. |
Время: 22:42.
© OSzone.net 2001-