С Новым годом! Форум программистов, компьютерный форум, киберфорум
C# Windows Forms
Войти
Регистрация
Восстановить пароль
Карта форума Темы раздела Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.50/4: Рейтинг темы: голосов - 4, средняя оценка - 4.50
1 / 1 / 3
Регистрация: 27.11.2014
Сообщений: 263
1

Вытаскивание текста из Word

26.10.2018, 12:17. Показов 744. Ответов 5
Метки нет (Все метки)

Author24 — интернет-сервис помощи студентам
Как считать программно из worda данные в переменные? (указано на скрине)
Соответственно название банка, бик и лицевого счёта в каждом документе разные.
Миниатюры
Вытаскивание текста из Word  
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
26.10.2018, 12:17
Ответы с готовыми решениями:

Вытаскивание текста из *.txt
Подскажите как вытащить текст из *.txt и позже использовать его в программе,текст не один. Ну вот...

Регулярные выражения и вытаскивание части текста
Вот к примеру есть текст: {add}Добавить{/add} {change}Изменить{/change} {add}Нужно добавить...

При открытии документа word 2013 в word 2010 меняется структура текста
Здравствуйте. Для вуза сделал в ворд 2013 два реферата. Пошел распечатывать. Оказалось, что в том...

"Вытаскивание" текста
Вообщем суть такая в Memo1 попадает строчка "L 121 T 435" Нужно сделать так чтобы после попадания...

5
8943 / 4855 / 1886
Регистрация: 11.02.2013
Сообщений: 10,246
26.10.2018, 12:37 2
Без примера документа ничего не получится
0
1 / 1 / 3
Регистрация: 27.11.2014
Сообщений: 263
26.10.2018, 23:24  [ТС] 3
ViterAlex, из таблицы как-то так вытащил

C#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
public void OpWord(string file, Form1 form)
        {
 
            try
            {
                object TM = Type.Missing;
                Object filename = file;
                Object confirmConversions = true;                   //При true в случае открытия документа не формата Word будет выводится диалоговое окно конвертирования файла
                Object readOnly = true;                            //При true документ открывается только для чтения            
                Object addToRecentFiles = false;                     //При true имя открываемого файла добавляется в список недавно открытых файлов в меню Файл.
                Object passwordDocument = TM;             //Пароль открываемого документа если он есть
                Object passwordTemplate = TM;             //Пароль шаблона документа если он есть
                Object revert = false;                              //При true возможно повторное открытие экземпляра того же документа с потерей изменений в открытом ранее. При false новый экземпляр не открывается.
                Object writePasswordDocument = TM;        //Пароль для сохранения документа   
                Object writePasswordTemplate = TM;        //Пароль для сохранения шаблона 
                Object format = TM;                       //Одна из следующих Word.WdOpenFormat констант wdOpenFormatAllWord, wdOpenFormatAuto, wdOpenFormatDocument,  wdOpenFormatEncodedText, wdOpenFormatRTF, wdOpenFormatTemplate, wdOpenFormatText, wdOpenFormatUnicodeText или wdOpenFormatWebPages. По умолчанию wdOpenFormatAuto.
                Object encoding = TM;                     //Кодовая страница, или набор символов, (кодировка) для просмотра документа, Значение по умолчанию - системная кодовая страница. Задается как Microsoft.Office.Core.MsoEncoding.msoEncodingUSASCII;
                Object oVisible = true;                             //При true документ открывается как видимый.
                Object openConflictDocument = TM;
                Object openAndRepair = TM;                //При true делается попытка восстановить поврежденный документ.
                Object documentDirection = TM;            //Направление текста - одна из Word.WdDocumentDirection констант: WdLeftToRight, WdRightToLeft.
                Object noEncodingDialog = false;                    //При true подавляется показ диалогового окна Encoding, которое отображается если кодировка не распознана.
                Object xmlTransform = TM;                 //Определяет тип XML данных при XML преобразованиях 
                wordapp = new Word.Application();                     //Открываем новое приложение Word
                wordapp.Visible = false;                             //Делаем его невидимым
                worddocument = wordapp.Documents.Open(ref filename, ref confirmConversions, ref readOnly, ref addToRecentFiles, ref passwordDocument, ref passwordTemplate, ref revert, ref writePasswordDocument, ref writePasswordTemplate, ref format, ref encoding, ref oVisible, ref openConflictDocument, ref documentDirection, ref noEncodingDialog, ref xmlTransform);    //Открываем нужный документ
                nameBank = worddocument.Range(worddocument.Tables[1].Cell(1, 1).Range.Start, worddocument.Tables[1].Cell(1, 1).Range.End - 1).Text;
                bankBook = worddocument.Range(worddocument.Tables[1].Cell(2, 3).Range.Start, worddocument.Tables[1].Cell(2, 3).Range.End - 1).Text;
                bik = worddocument.Range(worddocument.Tables[1].Cell(1, 3).Range.Start, worddocument.Tables[1].Cell(1, 3).Range.End - 1).Text;
                inn = worddocument.Range(worddocument.Tables[1].Cell(4, 1).Range.Start, worddocument.Tables[1].Cell(4, 1).Range.End - 1).Text;
                kpp = worddocument.Range(worddocument.Tables[1].Cell(4, 3).Range.Start, worddocument.Tables[1].Cell(4, 3).Range.End - 1).Text;
                nameAdresat = worddocument.Range(worddocument.Tables[1].Cell(5,1 ).Range.Start, worddocument.Tables[1].Cell(5, 1).Range.End - 1).Text;
                bankAdresat = worddocument.Range(worddocument.Tables[1].Cell(4, 6).Range.Start, worddocument.Tables[1].Cell(4, 6).Range.End - 1).Text;
                // и т.д. (данные взяли, далее делаем с ними, что хотим)
 
 
                form.label4.Text = String.Format("Имя банка: {0}", nameBank);
                form.label3.Text = String.Format("Коррекционный счёт: {0}", bankBook);
                form.label5.Text = String.Format("БИК банка: {0}", bik);
                form.label6.Text = String.Format("{0}", inn);
                form.label7.Text = String.Format("{0}", kpp);
                form.label8.Text = String.Format("Расчётный счёт: {0}" , bankAdresat);
                form.label9.Text = String.Format("Имя получателя: {0}", nameAdresat);
 
                form.label4.Visible = true;
                form.label3.Visible = true;
                form.label5.Visible = true;
                form.label6.Visible = true;
                form.label7.Visible = true;
                form.label8.Visible = true;
                form.label9.Visible = true;
 
 
            }
            catch (Exception e)
            {
                MessageBox.Show(e.Message + "\nВыберите другой файл"
                    + "\nВозможно искать стоит файлы:\n\"Счёт ######.docx\""
                    , "Таблица не найдена", MessageBoxButtons.OK, MessageBoxIcon.Stop);
            }
            worddocument.Close();
            wordapp.Quit(); // Закрываем Ворд
 
           
 
        }
ps Код нашёл на форуме
0
8943 / 4855 / 1886
Регистрация: 11.02.2013
Сообщений: 10,246
27.10.2018, 04:03 4
19boom96, чтобы вытащить из таблицы, нужно знать, какая именно это таблица в документе,не вложенная ли она, ну и прочие мелочи, киртан без примера документа узнать нельзя. Но ты жадничаешь
0
1 / 1 / 3
Регистрация: 27.11.2014
Сообщений: 263
29.10.2018, 15:44  [ТС] 5
ViterAlex, не жадничаю я) файлик прикрепил
копать в этом файле ещё много чего. буду разбираться и задавать вопросы тут)
Вложения
Тип файла: docx Счет пример.docx (15.2 Кб, 2 просмотров)
0
8943 / 4855 / 1886
Регистрация: 11.02.2013
Сообщений: 10,246
30.10.2018, 22:20 6
Таблица в документе первая, не вложенная. Судя по твоему коду, требуется получить больше данных. Значит нужна модель для их хранения, о которой прекрасно рассказывает Storm23 в соседней теме.
C#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
class InvoiceInfo
{
 
    public string BankName { get; set; }
    public string Bik { get; set; }
    public string BankBook { get; set; }
    public string Inn { get; set; }
    public string Kpp { get; set; }
    public string Account { get; set; }
    public string BeneficiaryName { get; set; }
 
    public override string ToString()
    {
        return this.ToString<InvoiceInfo>();
    }
}
Вспомогательный класс
C#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
static class WordHelper
{
    /// <summary>
    /// Удаление последних двух символов из текста ячейки таблицы
    /// </summary>
    /// <param name="cellText">Текст ячейки (свойство Range.Text)</param>
    internal static string CleanCellText(this string cellText)
    {
        return cellText.Substring(0, cellText.Length - 2);
    }
 
    /// <summary>
    /// Простое преобразование описания типа в строковое представление вида имя_свойства = значение_свойства
    /// </summary>
    internal static string ToString<T>(this T obj)
    {
        var pi = obj.GetType().GetProperties();
        var sb = new StringBuilder();
        foreach (var item in pi)
        {
            sb.AppendFormat("{0} = {1}", item.Name, item.GetValue(obj));
            sb.AppendLine();
        }
        return sb.ToString();
    }
}
Ну и пример
C#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
using Word = Microsoft.Office.Interop.Word;
using System;
using System.Text;
class Program
{
    static void Main(string[] args)
    {
        var app = new Word.Application();
        var doc = app.Documents.Open(@"Your filename", AddToRecentFiles: false);
        var inv = GetInvoiceInfo(doc);
        app.Quit(false);
        Console.WriteLine(inv.ToString());
    }
 
    static InvoiceInfo GetInvoiceInfo(Word.Document doc)
    {
        var result = new InvoiceInfo();
        var tblRng = doc.Tables[1].Range;
        result.BankName = tblRng.Cells[1].Range.Text.CleanCellText();
        result.Bik = tblRng.Cells[3].Range.Text.CleanCellText();
        result.BankBook = tblRng.Cells[5].Range.Text.CleanCellText();
        var inn = tblRng.Cells[7].Range.Text.CleanCellText().Split(new char[] { ' ' }, StringSplitOptions.RemoveEmptyEntries)[1];
        var kpp = tblRng.Cells[9].Range.Text.CleanCellText().Split(new char[] { ' ' }, StringSplitOptions.RemoveEmptyEntries)[1];
        result.Inn = inn;
        result.Kpp = kpp;
        result.Account = tblRng.Cells[12].Range.Text.CleanCellText();
        result.BeneficiaryName = tblRng.Cells[13].Range.Text.CleanCellText();
        return result;
    }
}
Результат:
Код
BankName = АО <Сбербанк>
Bik = 044525545
BankBook = 30101810300000000545
Inn = 7758962043
Kpp = 770401001
Account = 40702810200015896410
BeneficiaryName = ООО "Ромашка"
0
30.10.2018, 22:20
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
30.10.2018, 22:20
Помогаю со студенческими работами здесь

При добавлении текста в Word часть добавляемого текста сделать жирным
Здравствуйте. Добавляю текст в Word операторами (переменные CalcValue, Str: String формируются...

Выборка из текста (файл ms word) предложений и копирование в новый файл (ms word) с определенным форматом
Добрый день. Очень нужна помощь в создании макроса. Есть файлы в которых содержатся вопросы и...

Копирование текста в Word
Всем привет, имеется некоторый текст в Word(первый текст). Мне нужно провести над ним некоторые...

Выравнивание текста в word
Здравствуйте. нужна помощь в данном вопросе. нужно в выбранном файле(пользователь сам выбирает...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
6
Ответ Создать тему
Новые блоги и статьи
Книги и учебные ресурсы по C#
InfoMaster 08.01.2025
Базовые учебники и руководства Одной из лучших книг для начинающих является "C# 10 и . NET 6 для начинающих" Эндрю Троелсена и Филиппа Джепикса . Книга последовательно раскрывает основные концепции. . .
Что такое NullReferenceEx­­­ception и как исправить?
InfoMaster 08.01.2025
NullReferenceException - одно из самых распространенных исключений, с которым сталкиваются разработчики на C#. Это исключение возникает при попытке обратиться к членам объекта (методам, свойствам или. . .
Что такое Null Pointer Exception (NPE) и как это исправить?
InfoMaster 08.01.2025
Null Pointer Exception (NPE) - это одно из самых распространенных исключений в Java, которое возникает при попытке использовать ссылку на объект, значение которой равно null. Это исключение относится. . .
Русский язык в консоли C++
InfoMaster 08.01.2025
При разработке программ на C++ одной из частых проблем, с которой сталкиваются русскоязычные программисты, является корректное отображение кириллицы в консольных приложениях. Эта проблема особенно. . .
Telegram бот на C#
InfoMaster 08.01.2025
Разработка ботов для Telegram стала неотъемлемой частью современной экосистемы мессенджеров. C# предоставляет мощный и удобный инструментарий для создания разнообразных ботов, от простых. . .
Использование GraphQL в Go (Golang)
InfoMaster 08.01.2025
Go (Golang) является одним из наиболее популярных языков программирования, используемых для создания высокопроизводительных серверных приложений. Его архитектурные особенности и встроенные. . .
Что лучше использовать при создании класса в Java: сеттеры или конструктор?
Alexander-7 08.01.2025
Вопрос подробнее: На вопрос: «Когда одновременно создаются конструктор и сеттеры в классе – это нормально?» куратор уточнил: «Ваш класс может вообще не иметь сеттеров, а только конструктор и геттеры. . .
Как работать с GraphQL на TypeScript
InfoMaster 08.01.2025
Введение в GraphQL и TypeScript В современной разработке веб-приложений GraphQL стал мощным инструментом для создания гибких и эффективных API. В сочетании с TypeScript, эта технология. . .
Счётчик на базе сумматоров + регистров и генератора сигналов согласования.
Hrethgir 07.01.2025
Создан с целью проверки скорости асинхронной логики: ранее описанного сумматора и предополагаемых fast регистров. Регистры созданы на базе ранее описанного, предполагаемого fast триггера. То-есть. . .
Как перейти с Options API на Composition API в Vue.js
BasicMan 06.01.2025
Почему переход на Composition API актуален В мире современной веб-разработки фреймворк Vue. js продолжает эволюционировать, предлагая разработчикам все более совершенные инструменты для создания. . .
Архитектура современных процессоров
inter-admin 06.01.2025
Процессор (центральный процессор, ЦП) является основным вычислительным устройством компьютера, которое выполняет обработку данных и управляет работой всех остальных компонентов системы. Архитектура. . .
История создания реляционной модели баз данных, правила Кодда
Programming 06.01.2025
Предпосылки создания реляционной модели В конце 1960-х годов компьютерная индустрия столкнулась с серьезными проблемами в области управления данными. Существовавшие на тот момент модели данных -. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru