Viết chương trình Python đếm và trả về số từ trong một văn bản nhất định

Hàm phân tách ngắt chuỗi thành một danh sách có thể lặp lại với khoảng trắng dưới dạng dấu phân cách. nếu chức năng split[] được sử dụng mà không chỉ định không gian dấu phân cách được phân bổ làm dấu phân cách mặc định

Thí dụ

Bản thử trực tiếp

test_string = "Tutorials point is a learning platform"
#original string
print ["The original string is : " + test_string]
# using split[] function
res = len[test_string.split[]]
# total no of words
print ["The number of words in string are : " + str[res]]

đầu ra

The original string is : Tutorials point is a learning platform
The number of words in string are : 6

Cách tiếp cận 2 - Sử dụng mô-đun regex

Ở đây hàm findall[] được sử dụng để đếm số từ trong câu có sẵn trong mô-đun regex

Đếm [] là một hàm tích hợp trong Python. Nó sẽ trả về tổng số của một phần tử đã cho trong một chuỗi. Việc đếm bắt đầu từ đầu chuỗi cho đến khi kết thúc. Cũng có thể chỉ định chỉ mục bắt đầu và kết thúc từ nơi bạn muốn bắt đầu tìm kiếm

Trong hướng dẫn Python này, bạn sẽ học

Cú pháp cho Python String Count[]

Cú pháp hàm đếm trong Python

string.count[char or substring, start, end]

Các tham số của Cú pháp Python

  • Char hoặc chuỗi con. Bạn có thể chỉ định một ký tự hoặc chuỗi con mà bạn muốn tìm kiếm trong chuỗi đã cho. Nó sẽ trả về cho bạn số ký tự hoặc chuỗi con trong chuỗi đã cho
  • bắt đầu. [tùy chọn] Nó cho biết chỉ mục bắt đầu từ nơi tìm kiếm sẽ bắt đầu. Nếu không được cung cấp, nó sẽ bắt đầu từ 0. Ví dụ: bạn muốn tìm kiếm một ký tự từ giữa chuỗi. Bạn có thể cung cấp giá trị bắt đầu cho hàm đếm của mình
  • chấm dứt. [tùy chọn] Nó cho biết chỉ mục kết thúc nơi tìm kiếm kết thúc. Nếu không được cung cấp, nó sẽ tìm kiếm cho đến khi kết thúc danh sách hoặc chuỗi đã cho. Ví dụ: bạn không muốn quét toàn bộ chuỗi và giới hạn tìm kiếm cho đến một điểm cụ thể, bạn có thể đặt giá trị kết thúc trong hàm đếm của mình và bộ đếm sẽ đảm nhiệm việc tìm kiếm cho đến thời điểm đó

Giá trị trả về

Phương thức count[] sẽ trả về một giá trị số nguyên, i. e. , số phần tử đã cho từ chuỗi đã cho. Nó trả về 0 nếu không tìm thấy giá trị trong chuỗi đã cho

ví dụ 1. Phương pháp đếm trên một chuỗi

Ví dụ sau đây cho thấy sự xuất hiện của một ký tự trong một chuỗi nhất định cũng như trong bằng cách sử dụng chỉ mục bắt đầu/kết thúc

Đầu tiên, chúng tôi tạo một tệp văn bản mà chúng tôi muốn đếm số từ. Đặt tệp này là SampleFile. txt với nội dung sau

Tập tin trình diễn

Dưới đây là việc thực hiện

Python3




11
3

11
4

11
5
11
6
11
7

 

11
8

11
9

11
0
11
0______31
11
2
11
3
11
4
11
5
11
6
11
7

 

11
8
11
9

_______38____531

11
8____533

11
8
11
35
11
6
11
6
11
38

 

11
8
11
40

_______38____542

11
8
11
44
11
6
11
46

 

11
8
11
48

11
8
11
50

11
8____552

11
8
11
5____555
11
6
11
57
11
58

 

 

11
59

_______560____561

đầu ra.  

string.count[char or substring, start, end]
4

Giải trình.  

  • Tạo một biến mới để lưu tổng số từ trong tệp văn bản. Và sau đó mở tệp văn bản ở chế độ chỉ đọc bằng hàm open[]
  • Đọc nội dung của tệp bằng hàm read[] và lưu trữ chúng trong một biến mới. Và sau đó chia dữ liệu được lưu trữ trong biến dữ liệu thành các dòng riêng biệt bằng hàm split[] rồi lưu trữ chúng trong một biến mới. Và thêm độ dài của các dòng trong biến number_of_words của chúng tôi

ví dụ 2. Đếm số từ, không phải số nguyên

Tập tin trình diễn.  

Dưới đây là việc thực hiện.  

Python3




11
3

11
4

11
5
11
6
11
7

 

11
8

11
9

11
0
11
0______31
11
2
11
3
11
4
11
5
11
6
11
7

 

11
8
11
9

_______38____531

11
8____533

11
8
11
35
11
6
11
6
11
38

 

11
8
11
40

_______38____542

11
8
11
44
11
6
11
46

 

11
8
11
98

11
8
11
00

11
8
11
02
11
03______604
11
05

 

11
06
11
07

11
06
11
09
11
00
11
01

 

11
02
11
48

11
02____550

11
02
11
52

11
02
11
5
11
55
11
6
11
12

 

11
59

_______560____561

đầu ra

11

Giải trình. Tạo một biến mới để lưu tổng số từ trong tệp văn bản rồi mở tệp văn bản ở chế độ chỉ đọc bằng hàm open[]. Đọc nội dung của tệp bằng hàm read[] và lưu trữ chúng trong một biến mới, sau đó chia dữ liệu được lưu trữ trong biến dữ liệu thành các dòng riêng biệt bằng hàm split[] rồi lưu trữ chúng trong một biến mới, lặp lại qua mỗi

Chủ Đề