1 / 1 / 3
Регистрация: 27.11.2014
Сообщений: 263
1

Вытаскивание текста из Word

26.10.2018, 12:17. Показов 707. Ответов 5
Метки нет (Все метки)

Author24 — интернет-сервис помощи студентам
Как считать программно из worda данные в переменные? (указано на скрине)
Соответственно название банка, бик и лицевого счёта в каждом документе разные.
Миниатюры
Вытаскивание текста из Word  
0
Programming
Эксперт
94731 / 64177 / 26122
Регистрация: 12.04.2006
Сообщений: 116,782
26.10.2018, 12:17
Ответы с готовыми решениями:

Вытаскивание текста из *.txt
Подскажите как вытащить текст из *.txt и позже использовать его в программе,текст не один. Ну вот...

Регулярные выражения и вытаскивание части текста
Вот к примеру есть текст: {add}Добавить{/add} {change}Изменить{/change} {add}Нужно добавить...

При открытии документа word 2013 в word 2010 меняется структура текста
Здравствуйте. Для вуза сделал в ворд 2013 два реферата. Пошел распечатывать. Оказалось, что в том...

"Вытаскивание" текста
Вообщем суть такая в Memo1 попадает строчка "L 121 T 435" Нужно сделать так чтобы после попадания...

5
8942 / 4854 / 1886
Регистрация: 11.02.2013
Сообщений: 10,246
26.10.2018, 12:37 2
Без примера документа ничего не получится
0
1 / 1 / 3
Регистрация: 27.11.2014
Сообщений: 263
26.10.2018, 23:24  [ТС] 3
ViterAlex, из таблицы как-то так вытащил

C#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
public void OpWord(string file, Form1 form)
        {
 
            try
            {
                object TM = Type.Missing;
                Object filename = file;
                Object confirmConversions = true;                   //При true в случае открытия документа не формата Word будет выводится диалоговое окно конвертирования файла
                Object readOnly = true;                            //При true документ открывается только для чтения            
                Object addToRecentFiles = false;                     //При true имя открываемого файла добавляется в список недавно открытых файлов в меню Файл.
                Object passwordDocument = TM;             //Пароль открываемого документа если он есть
                Object passwordTemplate = TM;             //Пароль шаблона документа если он есть
                Object revert = false;                              //При true возможно повторное открытие экземпляра того же документа с потерей изменений в открытом ранее. При false новый экземпляр не открывается.
                Object writePasswordDocument = TM;        //Пароль для сохранения документа   
                Object writePasswordTemplate = TM;        //Пароль для сохранения шаблона 
                Object format = TM;                       //Одна из следующих Word.WdOpenFormat констант wdOpenFormatAllWord, wdOpenFormatAuto, wdOpenFormatDocument,  wdOpenFormatEncodedText, wdOpenFormatRTF, wdOpenFormatTemplate, wdOpenFormatText, wdOpenFormatUnicodeText или wdOpenFormatWebPages. По умолчанию wdOpenFormatAuto.
                Object encoding = TM;                     //Кодовая страница, или набор символов, (кодировка) для просмотра документа, Значение по умолчанию - системная кодовая страница. Задается как Microsoft.Office.Core.MsoEncoding.msoEncodingUSASCII;
                Object oVisible = true;                             //При true документ открывается как видимый.
                Object openConflictDocument = TM;
                Object openAndRepair = TM;                //При true делается попытка восстановить поврежденный документ.
                Object documentDirection = TM;            //Направление текста - одна из Word.WdDocumentDirection констант: WdLeftToRight, WdRightToLeft.
                Object noEncodingDialog = false;                    //При true подавляется показ диалогового окна Encoding, которое отображается если кодировка не распознана.
                Object xmlTransform = TM;                 //Определяет тип XML данных при XML преобразованиях 
                wordapp = new Word.Application();                     //Открываем новое приложение Word
                wordapp.Visible = false;                             //Делаем его невидимым
                worddocument = wordapp.Documents.Open(ref filename, ref confirmConversions, ref readOnly, ref addToRecentFiles, ref passwordDocument, ref passwordTemplate, ref revert, ref writePasswordDocument, ref writePasswordTemplate, ref format, ref encoding, ref oVisible, ref openConflictDocument, ref documentDirection, ref noEncodingDialog, ref xmlTransform);    //Открываем нужный документ
                nameBank = worddocument.Range(worddocument.Tables[1].Cell(1, 1).Range.Start, worddocument.Tables[1].Cell(1, 1).Range.End - 1).Text;
                bankBook = worddocument.Range(worddocument.Tables[1].Cell(2, 3).Range.Start, worddocument.Tables[1].Cell(2, 3).Range.End - 1).Text;
                bik = worddocument.Range(worddocument.Tables[1].Cell(1, 3).Range.Start, worddocument.Tables[1].Cell(1, 3).Range.End - 1).Text;
                inn = worddocument.Range(worddocument.Tables[1].Cell(4, 1).Range.Start, worddocument.Tables[1].Cell(4, 1).Range.End - 1).Text;
                kpp = worddocument.Range(worddocument.Tables[1].Cell(4, 3).Range.Start, worddocument.Tables[1].Cell(4, 3).Range.End - 1).Text;
                nameAdresat = worddocument.Range(worddocument.Tables[1].Cell(5,1 ).Range.Start, worddocument.Tables[1].Cell(5, 1).Range.End - 1).Text;
                bankAdresat = worddocument.Range(worddocument.Tables[1].Cell(4, 6).Range.Start, worddocument.Tables[1].Cell(4, 6).Range.End - 1).Text;
                // и т.д. (данные взяли, далее делаем с ними, что хотим)
 
 
                form.label4.Text = String.Format("Имя банка: {0}", nameBank);
                form.label3.Text = String.Format("Коррекционный счёт: {0}", bankBook);
                form.label5.Text = String.Format("БИК банка: {0}", bik);
                form.label6.Text = String.Format("{0}", inn);
                form.label7.Text = String.Format("{0}", kpp);
                form.label8.Text = String.Format("Расчётный счёт: {0}" , bankAdresat);
                form.label9.Text = String.Format("Имя получателя: {0}", nameAdresat);
 
                form.label4.Visible = true;
                form.label3.Visible = true;
                form.label5.Visible = true;
                form.label6.Visible = true;
                form.label7.Visible = true;
                form.label8.Visible = true;
                form.label9.Visible = true;
 
 
            }
            catch (Exception e)
            {
                MessageBox.Show(e.Message + "\nВыберите другой файл"
                    + "\nВозможно искать стоит файлы:\n\"Счёт ######.docx\""
                    , "Таблица не найдена", MessageBoxButtons.OK, MessageBoxIcon.Stop);
            }
            worddocument.Close();
            wordapp.Quit(); // Закрываем Ворд
 
           
 
        }
ps Код нашёл на форуме
0
8942 / 4854 / 1886
Регистрация: 11.02.2013
Сообщений: 10,246
27.10.2018, 04:03 4
19boom96, чтобы вытащить из таблицы, нужно знать, какая именно это таблица в документе,не вложенная ли она, ну и прочие мелочи, киртан без примера документа узнать нельзя. Но ты жадничаешь
0
1 / 1 / 3
Регистрация: 27.11.2014
Сообщений: 263
29.10.2018, 15:44  [ТС] 5
ViterAlex, не жадничаю я) файлик прикрепил
копать в этом файле ещё много чего. буду разбираться и задавать вопросы тут)
Вложения
Тип файла: docx Счет пример.docx (15.2 Кб, 2 просмотров)
0
8942 / 4854 / 1886
Регистрация: 11.02.2013
Сообщений: 10,246
30.10.2018, 22:20 6
Таблица в документе первая, не вложенная. Судя по твоему коду, требуется получить больше данных. Значит нужна модель для их хранения, о которой прекрасно рассказывает Storm23 в соседней теме.
C#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
class InvoiceInfo
{
 
    public string BankName { get; set; }
    public string Bik { get; set; }
    public string BankBook { get; set; }
    public string Inn { get; set; }
    public string Kpp { get; set; }
    public string Account { get; set; }
    public string BeneficiaryName { get; set; }
 
    public override string ToString()
    {
        return this.ToString<InvoiceInfo>();
    }
}
Вспомогательный класс
C#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
static class WordHelper
{
    /// <summary>
    /// Удаление последних двух символов из текста ячейки таблицы
    /// </summary>
    /// <param name="cellText">Текст ячейки (свойство Range.Text)</param>
    internal static string CleanCellText(this string cellText)
    {
        return cellText.Substring(0, cellText.Length - 2);
    }
 
    /// <summary>
    /// Простое преобразование описания типа в строковое представление вида имя_свойства = значение_свойства
    /// </summary>
    internal static string ToString<T>(this T obj)
    {
        var pi = obj.GetType().GetProperties();
        var sb = new StringBuilder();
        foreach (var item in pi)
        {
            sb.AppendFormat("{0} = {1}", item.Name, item.GetValue(obj));
            sb.AppendLine();
        }
        return sb.ToString();
    }
}
Ну и пример
C#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
using Word = Microsoft.Office.Interop.Word;
using System;
using System.Text;
class Program
{
    static void Main(string[] args)
    {
        var app = new Word.Application();
        var doc = app.Documents.Open(@"Your filename", AddToRecentFiles: false);
        var inv = GetInvoiceInfo(doc);
        app.Quit(false);
        Console.WriteLine(inv.ToString());
    }
 
    static InvoiceInfo GetInvoiceInfo(Word.Document doc)
    {
        var result = new InvoiceInfo();
        var tblRng = doc.Tables[1].Range;
        result.BankName = tblRng.Cells[1].Range.Text.CleanCellText();
        result.Bik = tblRng.Cells[3].Range.Text.CleanCellText();
        result.BankBook = tblRng.Cells[5].Range.Text.CleanCellText();
        var inn = tblRng.Cells[7].Range.Text.CleanCellText().Split(new char[] { ' ' }, StringSplitOptions.RemoveEmptyEntries)[1];
        var kpp = tblRng.Cells[9].Range.Text.CleanCellText().Split(new char[] { ' ' }, StringSplitOptions.RemoveEmptyEntries)[1];
        result.Inn = inn;
        result.Kpp = kpp;
        result.Account = tblRng.Cells[12].Range.Text.CleanCellText();
        result.BeneficiaryName = tblRng.Cells[13].Range.Text.CleanCellText();
        return result;
    }
}
Результат:
Код
BankName = АО <Сбербанк>
Bik = 044525545
BankBook = 30101810300000000545
Inn = 7758962043
Kpp = 770401001
Account = 40702810200015896410
BeneficiaryName = ООО "Ромашка"
0
30.10.2018, 22:20
IT_Exp
Эксперт
87844 / 49110 / 22898
Регистрация: 17.06.2006
Сообщений: 92,604
30.10.2018, 22:20
Помогаю со студенческими работами здесь

При добавлении текста в Word часть добавляемого текста сделать жирным
Здравствуйте. Добавляю текст в Word операторами (переменные CalcValue, Str: String формируются...

Выборка из текста (файл ms word) предложений и копирование в новый файл (ms word) с определенным форматом
Добрый день. Очень нужна помощь в создании макроса. Есть файлы в которых содержатся вопросы и...

Копирование текста в Word
Всем привет, имеется некоторый текст в Word(первый текст). Мне нужно провести над ним некоторые...

Выравнивание текста в word
Здравствуйте. нужна помощь в данном вопросе. нужно в выбранном файле(пользователь сам выбирает...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
6
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2024, CyberForum.ru