С Новым годом! Форум программистов, компьютерный форум, киберфорум
MS Office Word
Войти
Регистрация
Восстановить пароль
Карта форума Темы раздела Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.57/7: Рейтинг темы: голосов - 7, средняя оценка - 4.57
0 / 1 / 0
Регистрация: 09.02.2014
Сообщений: 270
1

Вот возможно ли осуществить поиск одной и той же информации основываясь на 100ни разных текстовых документов ?

17.12.2016, 01:05. Показов 1466. Ответов 6
Метки нет (Все метки)

Author24 — интернет-сервис помощи студентам
Вот сталкнулся с такой значит проблмой:

Помогаю другу с Гистологией. Справочной инфы из документов коих 40 штук вытягивает на 750мб...

Форматы файлов такие как: txt, doc, docx, ppt, pptx, pdf, так же иногда приходится работать и за одно с форматами rtf, odt, xls, и т.п. и html

В общем все они как бы текстовые! Но и разные, там могут быть и обычные доки и более сложные доки разных Офисов
Так же таблицы и документы с разными разметками...

Так вот мне надо чтобы я чем то как то обозначил эту кучу как то где я бы производил поиск информации и искал бы сразу бы со всех документов (файлов) текст как в ручную, так и по сравнению...

К примеру слов из одного документа с этой кучей... По словам или по предложениям если то возможно... или по списку ключевых слов, если и такое возможно...
Миниатюры
Вот возможно ли осуществить поиск одной и той же информации основываясь на 100ни разных текстовых документов ?  
0
Лучшие ответы (1)
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
17.12.2016, 01:05
Ответы с готовыми решениями:

Подключение к одной и той же БД из разных виджетов
Есть такой код /* Методы для подключения к базе данных * */ void DataBase::connectToDataBase()...

Вывод случайного элемента в <div> из массива текстовых документов расположенных в одной папке
Всем привет! :) Ситуация следующая: имеется папка с множеством текстовых документов (1.txt,...

Выполнение разных процедур одной и той же кнопкой
Option Explicit On Imports System Imports Microsoft.Win32 Imports System.IO Imports System.Text...

Работа с одной и той же книгой Excel из разных форм
Есть две формы. В первой вывожу инф-ю из exel'я , во второй редактирую эту инф-ю (в это время exel...

6
0 / 1 / 0
Регистрация: 09.02.2014
Сообщений: 270
17.12.2016, 01:16  [ТС] 2
В общем мне надо сделать склад всех этих скаченных текстовых документов поисковой базой...

Как это реализовать и с помощью чего вообще без понятий! Может и не через Офис может и через что то ещё...

Нооо надо вот сделать как то так вота...
0
Модератор
Эксперт MS Access
12106 / 4966 / 791
Регистрация: 07.08.2010
Сообщений: 14,596
Записей в блоге: 4
17.12.2016, 23:36 3
самый проблемный из них --это pdf
все остальные обычно можно привести к одному виду, хотя бы в ТХТ
С pdf ЭТО ВЫХОДИТ ДАЛЕКО НЕ ВСЕГДА
0
0 / 1 / 0
Регистрация: 09.02.2014
Сообщений: 270
18.12.2016, 16:23  [ТС] 4
Цитата Сообщение от shanemac51 Посмотреть сообщение
все остальные обычно можно привести к одному виду
А если их будет 1000 доков что тогда ?! Мне что то там приводить ?!
0
Модератор
Эксперт MS Access
12106 / 4966 / 791
Регистрация: 07.08.2010
Сообщений: 14,596
Записей в блоге: 4
20.12.2016, 06:37 5
Цитата Сообщение от Kiber-Net Посмотреть сообщение
Мне что то там приводить ?
для этого есть макросы
0
4082 / 1462 / 401
Регистрация: 07.08.2013
Сообщений: 3,657
20.12.2016, 07:10 6
Лучший ответ Сообщение было отмечено Kiber-Net как решение

Решение

есть же специализированные программы для этого дела
FileLocatorPro, Multi Text Finder, Folder Find Text
или это не подходит?
1
Динохромный
1402 / 765 / 284
Регистрация: 22.12.2015
Сообщений: 2,387
20.12.2016, 09:12 7
Цитата Сообщение от Kiber-Net Посмотреть сообщение
ак вот мне надо чтобы я чем то как то обозначил эту кучу как то где я бы производил поиск информации и искал бы сразу бы со всех документов (файлов) текст как в ручную, так и по сравнению...
Самый очевидный незатейливый вариант - переведите все ваши текстовые файлы в pdf. Тем более что в ваших файлах есть таблицы.

Конвертеров сейчас много, возможность поиска после конвертации будет сохранена. Изначально проблемные pdf, в которых поиск действовать не будет, можно распознать файнридером.

Потом можно собрать все в один общий файл и искать в нем. Можно не объединять и искать например во всех открытых документов. В pdf очень удобно размечать текст маркерами, выставлять закладки, текст в общем-то копируется.
0
20.12.2016, 09:12
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
20.12.2016, 09:12
Помогаю со студенческими работами здесь

Автоматический Update одной и той же программы на разных машинах
Всем привет) Причина апдейта думаю всем будет понятна, кто работает в коллективе, который не...

Использование одной и той же кнопки в двух разных местах
Существует необходимость использования одной и той же кнопки в двух разных местах, можно ли...

Не сходятся токи одной и той же эл.цепи в разных системах моделирования
Электрическая цепь в двух средах:MATLAB и Multisim.Почему не совпадают токи?

Автоматическая печать документов из разных папок в одной директории
Друзья, нужна ваша помощь! Возможно ли создать макрос, который в выбранной директории поочередно...

Какова вероятность того, что 2 сильнейшие команды окажутся: 1) в разных подгруппах? 2) в одной и той же подгруппе
16 команд разбиваются на 2 подгруппы. Какова вероятность того, что 2 сильнейшие команды окажутся:...

Осуществить поиск по заданному полю в разных таблицах
procedure TForm1.Edit10Change(Sender: TObject); var help1: String; begin help1:= '%' +...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
7
Ответ Создать тему
Новые блоги и статьи
Как программировать под HCL Notes и создавать свои продукты на ее основе
InfoMaster 11.01.2025
HCL Notes (ранее известный как IBM Notes и Lotus Notes) представляет собой мощную платформу для разработки корпоративных приложений, которая сочетает в себе функции электронной почты, календаря,. . .
Как работать с SVN (Subversion)
InfoMaster 11.01.2025
Введение Система контроля версий является неотъемлемой частью современного процесса разработки программного обеспечения. Она обеспечивает управление изменениями в коде, позволяет отслеживать. . .
Использование GraphQL в JavaScript
InfoMaster 11.01.2025
Введение в GraphQL и его преимущества В современной разработке веб-приложений эффективный обмен данными между клиентом и сервером играет ключевую роль. GraphQL представляет собой язык запросов и. . .
Администрирован­­­­ие Git, продвинутые техники работы с Git
InfoMaster 11.01.2025
Основы управления репозиторием Эффективное управление Git-репозиторием требует глубокого понимания механизмов контроля доступа и инструментов администрирования. Рассмотрим ключевые аспекты. . .
Что такое HCL Notes и как с ним работать
InfoMaster 10.01.2025
HCL Notes (ранее известный как IBM Notes и Lotus Notes) представляет собой комплексную платформу для совместной работы и обмена информацией в корпоративной среде. Это многофункциональное решение,. . .
Как работать с Git из Windows и Visual Studio
InfoMaster 10.01.2025
Работа с Git в Windows Работа с Git в операционной системе Windows может быть осуществлена с помощью различных инструментов, каждый из которых обладает своими уникальными возможностями и. . .
Аналог оператора switch case в Python
InfoMaster 10.01.2025
Оператор switch case используется в программировании для выбора одного из нескольких вариантов исполнения кода. Однако в языке Python этот оператор отсутствует. Понимание аналогов switch case в. . .
Отличия абстрактного класса от интерфейса
InfoMaster 10.01.2025
В современной разработке программного обеспечения существуют два основных механизма реализации абстракции: абстрактные классы и интерфейсы. Эти инструменты, хотя и схожи в своей основной цели -. . .
Как работать в Git
InfoMaster 10.01.2025
Git — это одна из наиболее популярных систем контроля версий, которая активно используется разработчиками по всему миру. Она позволяет эффективно управлять изменениями в коде, координировать работу. . .
Реализация передвижения персонажа в Unity3d на C#
InfoMaster 10.01.2025
Реализация передвижения персонажа в Unity3D начинается с правильной настройки проекта. Этот этап критически важен для создания отзывчивого и плавного управления. Рассмотрим основные шаги для создания. . .
Docker: руководство для начинающих
InfoMaster 10.01.2025
В современном мире разработки программного обеспечения контейнеризация стала неотъемлемой частью процесса создания и развертывания приложений. Docker, как ведущая платформа контейнеризации, произвела. . .
Книги и учебные ресурсы по C#
InfoMaster 08.01.2025
Базовые учебники и руководства Одной из лучших книг для начинающих является "C# 10 и . NET 6 для начинающих" Эндрю Троелсена и Филиппа Джепикса . Книга последовательно раскрывает основные концепции. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru