MAFFT Trăn

MAFFT (Multiple Alignment using Fast Fourier Transform) là chương trình căn chỉnh nhiều chuỗi tốc độ cao

Gần đây chúng tôi đã thay đổi cài đặt tham số mặc định cho MAFFT. Việc sắp xếp sẽ chạy nhanh hơn nhiều và việc sắp xếp DNA lớn hơn có thể được thực hiện theo mặc định. Vui lòng nhấp vào nút 'Tùy chọn khác' để xem lại các giá trị mặc định và thay đổi chúng nếu cần

Lưu ý quan trọng. Công cụ này có thể căn chỉnh tối đa 500 trình tự hoặc kích thước tệp tối đa là 1 MB

BƯỚC 1 - Nhập trình tự đầu vào của bạn

một tập hợp các trình tự ở bất kỳ định dạng được hỗ trợ nào

Hoặc một tập tin

BƯỚC 2 - Đặt thông số của bạn

BƯỚC 3 - Gửi công việc của bạn

(Đánh dấu vào ô này nếu bạn muốn được thông báo qua email khi có kết quả)

Nếu có, tiêu đề sẽ được đưa vào chủ đề của email thông báo và có thể được sử dụng như một cách để xác định phân tích của bạn

Thêm tùy chọn bổ sung cho chương trình dòng lệnh. Các tùy chọn này được đặt trước các đối số được xác định tự động bởi lớp con LocalApp tương ứng

Phương pháp này tập trung vào người dùng nâng cao, những người có kiến ​​thức về các tùy chọn có sẵn của chương trình dòng lệnh và các tùy chọn đã được sử dụng bởi lớp con LocalApp. Bỏ qua các tùy chọn đã được sử dụng có thể dẫn đến các đối số CLI xung đột và các kết quả không mong muốn tiềm ẩn. Bạn chỉ nên sử dụng phương thức này khi lớp con LocalApp tương ứng không cung cấp phương thức để đặt tùy chọn mong muốn

Thông số . tùy chọn danh sách str

Một danh sách các chuỗi đại diện cho các tùy chọn dòng lệnh

ghi chú

Để xem thực thi dòng lệnh đã sử dụng những tùy chọn nào, hãy thử phương pháp get_command()

ví dụ

>>> seq1 = ProteinSequence("BIQTITE")
>>> seq2 = ProteinSequence("TITANITE")
>>> seq3 = ProteinSequence("BISMITE")
>>> seq4 = ProteinSequence("IQLITE")
>>> # Run application without additional arguments
>>> app = ClustalOmegaApp([seq1, seq2, seq3, seq4])
>>> app.start()
>>> app.join()
>>> print(app.get_command())
clustalo --in ...fa --out ...fa --force --output-order=tree-order --seqtype Protein --guidetree-out ...tree
>>> # Run application with additional argument
>>> app = ClustalOmegaApp([seq1, seq2, seq3, seq4])
>>> app.add_additional_options(["--full"])
>>> app.start()
>>> app.join()
>>> print(app.get_command())
clustalo --full --in ...fa --out ...fa --force --output-order=tree-order --seqtype Protein --guidetree-out ...tree

phương pháp phân lớp căn chỉnh(trình tự , bin_path=None, matrix=None)

Thực hiện căn chỉnh nhiều trình tự

Đây là một chức năng tiện lợi, kết thúc quá trình thực thi

>>> seq1 = ProteinSequence("BIQTITE")
>>> seq2 = ProteinSequence("TITANITE")
>>> seq3 = ProteinSequence("BISMITE")
>>> seq4 = ProteinSequence("IQLITE")
>>> app = ClustalOmegaApp([seq1, seq2, seq3, seq4])
>>> app.start()
>>> print(app.get_command())
clustalo --in ...fa --out ...fa --force --output-order=tree-order --seqtype Protein --guidetree-out ...tree
0

Thông số . sequences đối tượng có thể lặp lại của Sequence

Các trình tự được căn chỉnh

bin_path str, tùy chọn

Đường dẫn của nhị phân phần mềm MSA. Theo mặc định, đường dẫn mặc định sẽ được sử dụng

ma trận Ma trận thay thế, tùy chọn

Một ma trận thay thế tùy chỉnh

Trả về . căn chỉnh Căn chỉnh

Căn chỉnh nhiều chuỗi toàn cầu

hủy()

Hủy đơn khi ở trạng thái CHẠY hoặc HOÀN TẤT

dọn dẹp()

Dọn dẹp công việc sau khi ứng dụng kết thúc

BẢO VỆ. Tùy chọn ghi đè khi kế thừa

đánh giá()

Đánh giá kết quả ứng dụng. Được gọi vào

>>> seq1 = ProteinSequence("BIQTITE")
>>> seq2 = ProteinSequence("TITANITE")
>>> seq3 = ProteinSequence("BISMITE")
>>> seq4 = ProteinSequence("IQLITE")
>>> app = ClustalOmegaApp([seq1, seq2, seq3, seq4])
>>> app.start()
>>> print(app.get_command())
clustalo --in ...fa --out ...fa --force --output-order=tree-order --seqtype Protein --guidetree-out ...tree
1

BẢO VỆ. Ghi đè khi kế thừa

get_alignment()

Nhận kết quả căn chỉnh nhiều trình tự

Trả về . căn chỉnh Căn chỉnh

Căn chỉnh nhiều chuỗi toàn cầu

get_alignment_order()

Nhận thứ tự sắp xếp nhiều chuỗi kết quả

Thông thường thứ tự các chuỗi trong tệp đầu ra khác với tệp đầu vào, e. g. trình tự được sắp xếp theo cây hướng dẫn. Sau khi chạy phần mềm MSA, thứ tự trình tự đầu ra của căn chỉnh được sắp xếp lại sao cho giống với thứ tự đầu vào. Phương thức này trả về thứ tự của các chuỗi dự định bởi phần mềm MSA

Trả về . đặt hàng ndarray, dtype=int

Trình tự dự định của phần mềm MSA

ví dụ

Căn chỉnh trình tự và khôi phục lại thứ tự ban đầu

app = ứng dụng ClustalOmegaApp(sequences). bắt đầu () ứng dụng. liên kết () căn chỉnh = ứng dụng. get_alignment() thứ tự = ứng dụng. get_alignment_order() căn chỉnh = căn chỉnh [. , gọi món]

get_app_state()

Nhận trạng thái ứng dụng hiện tại

Trả về . app_state AppState

Trạng thái ứng dụng hiện tại

get_command()

Nhận lệnh đã thực hiện

Không thể được gọi cho đến khi ứng dụng đã được bắt đầu

Trả về . lệnh str

Lệnh đã thực hiện

ví dụ

>>> seq1 = ProteinSequence("BIQTITE")
>>> seq2 = ProteinSequence("TITANITE")
>>> seq3 = ProteinSequence("BISMITE")
>>> seq4 = ProteinSequence("IQLITE")
>>> app = ClustalOmegaApp([seq1, seq2, seq3, seq4])
>>> app.start()
>>> print(app.get_command())
clustalo --in ...fa --out ...fa --force --output-order=tree-order --seqtype Protein --guidetree-out ...tree

get_exit_code()

Lấy mã thoát của quy trình

BẢO VỆ. Không gọi từ bên ngoài

Trả về . int

Mã thoát

get_guide_tree()

Nhận cây hướng dẫn được tạo để căn chỉnh lũy tiến

Trả về . cây Cây

Cây hướng dẫn

get_input_file_path()

Nhận đường dẫn tệp đầu vào (định dạng FASTA)

BẢO VỆ. Không gọi từ bên ngoài

Trả về . đường dẫn str

Đường dẫn của tệp đầu vào

get_matrix_file_path()

Nhận đường dẫn tệp cho ma trận thay thế tùy chỉnh

BẢO VỆ. Không gọi từ bên ngoài

Trả về . đường dẫn str hoặc Không có

Đường dẫn của ma trận thay thế. Không có nếu không có ma trận được đưa ra

get_output_file_path()

Nhận đường dẫn tệp đầu ra (định dạng FASTA)

BẢO VỆ. Không gọi từ bên ngoài

Trả về . đường dẫn str

Đường dẫn của tập tin đầu ra

get_process()

Lấy ví dụ Popen

BẢO VỆ. Không gọi từ bên ngoài

Trả về . quy trình Popen

Ví dụ Popen

get_seqtype()

Nhận loại trình tự được căn chỉnh

Khi một loại trình tự tùy chỉnh (không phải nucleotide cũng không phải protein) được ánh xạ lên một trình tự protein, giá trị trả về cũng là

>>> seq1 = ProteinSequence("BIQTITE")
>>> seq2 = ProteinSequence("TITANITE")
>>> seq3 = ProteinSequence("BISMITE")
>>> seq4 = ProteinSequence("IQLITE")
>>> # Run application without additional arguments
>>> app = ClustalOmegaApp([seq1, seq2, seq3, seq4])
>>> app.start()
>>> app.join()
>>> print(app.get_command())
clustalo --in ...fa --out ...fa --force --output-order=tree-order --seqtype Protein --guidetree-out ...tree
>>> # Run application with additional argument
>>> app = ClustalOmegaApp([seq1, seq2, seq3, seq4])
>>> app.add_additional_options(["--full"])
>>> app.start()
>>> app.join()
>>> print(app.get_command())
clustalo --full --in ...fa --out ...fa --force --output-order=tree-order --seqtype Protein --guidetree-out ...tree
0

BẢO VỆ. Không gọi từ bên ngoài

Trả về . seqtype {‘nucleotide’, ‘protein’}

Loại trình tự được căn chỉnh

get_stderr()

Nhận nội dung đường ống STDERR của quy trình

BẢO VỆ. Không gọi từ bên ngoài

Trả về . stdout str

lỗi tiêu chuẩn

get_stdout()

Nhận nội dung ống STDOUT của quy trình

BẢO VỆ. Không gọi từ bên ngoài

Trả về . stdout str

đầu ra tiêu chuẩn

is_finished()

Kiểm tra xem ứng dụng đã kết thúc chưa

BẢO VỆ. Ghi đè khi kế thừa

Trả về . xong bool

True của ứng dụng đã hoàn thành, false nếu không

tham gia(hết thời gian=Không có)

Kết thúc chạy ứng dụng và đặt trạng thái của nó thành THAM GIA. Điều này chỉ có thể được thực hiện từ trạng thái CHẠY hoặc HOÀN THÀNH

Nếu ứng dụng ĐÃ HOÀN TẤT, quá trình tham gia diễn ra ngay lập tức, nếu không thì ứng dụng ĐANG CHẠY, phương pháp này sẽ đợi cho đến khi ứng dụng HOÀN TẤT

Thông số . thời gian chờ thả nổi, tùy chọn

Nếu tham số này được chỉ định, thì

>>> seq1 = ProteinSequence("BIQTITE")
>>> seq2 = ProteinSequence("TITANITE")
>>> seq3 = ProteinSequence("BISMITE")
>>> seq4 = ProteinSequence("IQLITE")
>>> # Run application without additional arguments
>>> app = ClustalOmegaApp([seq1, seq2, seq3, seq4])
>>> app.start()
>>> app.join()
>>> print(app.get_command())
clustalo --in ...fa --out ...fa --force --output-order=tree-order --seqtype Protein --guidetree-out ...tree
>>> # Run application with additional argument
>>> app = ClustalOmegaApp([seq1, seq2, seq3, seq4])
>>> app.add_additional_options(["--full"])
>>> app.start()
>>> app.join()
>>> print(app.get_command())
clustalo --full --in ...fa --out ...fa --force --output-order=tree-order --seqtype Protein --guidetree-out ...tree
1 chỉ chờ kết thúc cho đến khi hết giá trị này (tính bằng giây). Sau khi vượt quá thời gian này, một
>>> seq1 = ProteinSequence("BIQTITE")
>>> seq2 = ProteinSequence("TITANITE")
>>> seq3 = ProteinSequence("BISMITE")
>>> seq4 = ProteinSequence("IQLITE")
>>> # Run application without additional arguments
>>> app = ClustalOmegaApp([seq1, seq2, seq3, seq4])
>>> app.start()
>>> app.join()
>>> print(app.get_command())
clustalo --in ...fa --out ...fa --force --output-order=tree-order --seqtype Protein --guidetree-out ...tree
>>> # Run application with additional argument
>>> app = ClustalOmegaApp([seq1, seq2, seq3, seq4])
>>> app.add_additional_options(["--full"])
>>> app.start()
>>> app.join()
>>> print(app.get_command())
clustalo --full --in ...fa --out ...fa --force --output-order=tree-order --seqtype Protein --guidetree-out ...tree
2 được nâng lên và ứng dụng bị hủy

Tăng . Lỗi hết giờ

Nếu quá trình tham gia vượt quá giá trị thời gian chờ

chạy()

Bắt đầu chạy ứng dụng. Được gọi vào

>>> seq1 = ProteinSequence("BIQTITE")
>>> seq2 = ProteinSequence("TITANITE")
>>> seq3 = ProteinSequence("BISMITE")
>>> seq4 = ProteinSequence("IQLITE")
>>> # Run application without additional arguments
>>> app = ClustalOmegaApp([seq1, seq2, seq3, seq4])
>>> app.start()
>>> app.join()
>>> print(app.get_command())
clustalo --in ...fa --out ...fa --force --output-order=tree-order --seqtype Protein --guidetree-out ...tree
>>> # Run application with additional argument
>>> app = ClustalOmegaApp([seq1, seq2, seq3, seq4])
>>> app.add_additional_options(["--full"])
>>> app.start()
>>> app.join()
>>> print(app.get_command())
clustalo --full --in ...fa --out ...fa --force --output-order=tree-order --seqtype Protein --guidetree-out ...tree
3

BẢO VỆ. Ghi đè khi kế thừa

set_arguments(arguments)

Đặt đối số dòng lệnh cho ứng dụng chạy

BẢO VỆ. Không gọi từ bên ngoài

Thông số . đối số danh sách str

Một danh sách các chuỗi đại diện cho các tùy chọn dòng lệnh

set_exec_dir(exec_dir)

Đặt thư mục nơi ứng dụng sẽ được thực thi. Nếu không được đặt, nó sẽ được thực thi trong thư mục làm việc tại thời điểm ứng dụng được tạo

BẢO VỆ. Không gọi từ bên ngoài

Thông số . exec_dir str

Thư mục thực hiện

set_stdin(tệp)

Đặt tệp làm đầu vào tiêu chuẩn để chạy ứng dụng

BẢO VỆ. Không gọi từ bên ngoài

Thông số . tệp đối tượng tệp

Tệp cho đầu vào tiêu chuẩn. Phải có một bộ mô tả tập tin hợp lệ, e. g. các đối tượng giống như tệp như StringIO không hợp lệ

bắt đầu()

Bắt đầu chạy ứng dụng và đặt trạng thái của nó thành CHẠY. Điều này chỉ có thể được thực hiện từ trạng thái TẠO

MAFFT trong tin sinh học là gì?

MAFFT (Multiple Alignment sử dụng Fast Fourier Transform) là chương trình căn chỉnh nhiều chuỗi tốc độ cao . Gần đây chúng tôi đã thay đổi cài đặt tham số mặc định cho MAFFT. Việc sắp xếp sẽ chạy nhanh hơn nhiều và việc sắp xếp DNA lớn hơn có thể được thực hiện theo mặc định.

Căn chỉnh MAFFT là gì?

MAFFT là chương trình căn chỉnh nhiều trình tự cho các hệ điều hành giống unix . Nó cung cấp một loạt các phương pháp căn chỉnh, L-INS-i (chính xác; để căn chỉnh

MAFFT tiến bộ hay lặp đi lặp lại?

MAFFT cung cấp nhiều chiến lược căn chỉnh khác nhau. Chúng được phân thành ba loại, (a) phương pháp lũy tiến , (b) phương pháp sàng lọc lặp đi lặp lại với điểm số WSP và (c) phương pháp lặp lại . Nói chung, có sự đánh đổi giữa tốc độ và độ chính xác.

MAFFT sắp xếp trình tự như thế nào?

Bây giờ, chúng ta có thể thực hiện Căn chỉnh trình tự với MAFFT trong Terminal bằng các bước sau. .
Định vị đến thư mục làm việc
Gọi “mafft” bên trong thiết bị đầu cuối
Đối với tệp đầu vào, đặt “SEQUENCES. .
Đối với tệp đầu ra, đặt “đầu ra. .
Chọn “1” cho “Định dạng cụm” làm định dạng đầu ra
Chọn “1” cho “tự động” làm chiến lược