Công nghệ cao

Tin sinh học

  Tin sinh học đã trở thành một phần quan trọng của nhiều lĩnh vực sinh học. Trong sinh học phân tử thực nghiệm, các kỹ thuật tin sinh học như xử lý hình ảnh và tín hiệu cho phép trích xuất các kết quả hữu ích từ một lượng lớn dữ liệu thô. Trong lĩnh vực di truyền học, nó hỗ trợ giải trình tự và chú thích bộ gen và các đột biến quan sát được của chúng. Nó đóng một vai trò trong việc khai thác văn bản của tài liệu sinh học và phát triển các bản thể sinh học và gen để tổ chức và truy vấn dữ liệu sinh học. Nó cũng đóng một vai trò trong việc phân tích biểu hiện và quy định gen và protein. 
 
                                              
   
   Các công cụ tin sinh học hỗ trợ trong việc so sánh dữ liệu di truyền và bộ gen và nói chung hơn là sự hiểu biết về các khía cạnh tiến hóa của sinh học phân tử. Ở cấp độ tích hợp hơn, nó giúp phân tích và lập danh mục các con đường và mạng lưới sinh học là một phần quan trọng của sinh học hệ thống . Trong sinh học cấu trúc , nó hỗ trợ trong việc mô phỏng và mô hình hóa DNA, RNA, protein cũng như tương tác phân tử sinh học.


Tin sinh học là gì? 

   Thuật ngữ Tin sinh học lần đầu tiên được công nhận toàn thế giới vào năm 1991.
   Tin sinh học là một lĩnh vực khoa học sử dụng các công nghệ của các ngành toán học ứng dụng, tin học, thống kê, khoa học máy tính, trí tuệ nhân tạo, hóa học và hóa sinh. Để giải quyết các vấn đề sinh học chuyên sâu, quy mô lớn được giải quyết theo quan điểm tính toán. Các vấn đề phổ biến nhất là mô hình hóa các quá trình sinh học ở cấp độ phân tử và suy luận từ dữ liệu thu thập được.

                                               
Hình ảnh gel của DNA của 96 con ngựa được hiển thị trên màn hình máy tính tại phòng thí nghiệm di truyền thú y UC Davis ở Dav
 
   Một thuật ngữ thường được dùng thay thế cho tin sinh học là sinh học tính toán. Tuy nhiên, tin sinh học thiên về việc phát triển các giải thuật, lý thuyết và các kĩ thuật thống kê và tính toán để giải quyết các bài toán bắt nguồn từ nhu cầu quản lý và phân tích dữ liệu sinh học. Trong khi đó, sinh học tính toán thiên về kiểm định các giả thuyết được đặt ra của một vấn đề trong sinh học nhờ máy tính thực nghiệm trên dữ liệu mô phỏng, với mục đích chính là phát hiện và nâng cao tri thức về sinh học (ví dụ: dự đoán mối quan hệ tương tác giữa các protein, dự đoán cấu trúc bậc 2 phân tử của protein, v.v.).Một giải pháp tin sinh học thường bao gồm các bước sau:
  • Thu thập số liệu thống kê từ dữ liệu sinh học
  • Xây dựng mô hình tính toán
  • Giải một bài toán mô hình tính toán
  • Kiểm tra và đánh giá một thuật toán tính toán.
Mục tiêu chính của tin sinh học
  • Là tăng cường sự hiểu biết về các quá trình sinh học. Tuy nhiên, điều làm cho nó khác biệt so với các phương pháp khác là tập trung vào phát triển và áp dụng các kỹ thuật chuyên sâu tính toán để đạt được mục tiêu này. Các ví dụ bao gồm: nhận dạng mẫu, khai thác dữ liệu, thuật toán học máy và trực quan hóa . Những nỗ lực nghiên cứu chính trong lĩnh vực này bao gồm căn chỉnh trình tự, tìm kiếm gen, lắp ráp bộ gen, thiết kế thuốc, khám phá cấu trúc protein, dự đoán cấu trúc protein , dự đoán biểu hiện gen và tương tác protein, nghiên cứu liên kết toàn bộ gen, mô hình tiến hóa và phân chia tế bào.
Các lĩnh vực nghiên cứu chính
  • Hệ gen học
  • Sinh học tiến hóa
  • Phân tích chức năng gen
  • Các hệ thống sinh học kiểu mẫu
  • Phân tích hình ảnh mức độ cao

   Các hoạt động phổ biến trong tin sinh học bao gồm lập bản đồ và phân tích chuỗi DNA và protein, sắp xếp chuỗi DNA và protein để so sánh chúng, và tạo và xem mô hình 3-D của cấu trúc protein

Ứng dụng của tin sinh học

       Một trong những ứng dụng đầu tiên của tin sinh học là truy tìm sự giống nhau về chuỗi để tìm nguồn gốc các gen của virus.


Công cụ phần mềm được sử dụng

    Một trong các công cụ dùng trong tin sinh học nổi tiếng nhất là BLAST, một giải thuật để tìm kiếm những trình tự nucleic acid hoặc protein tương đồng lưu trữ trên các cơ sở dữ liệu. 

                                           

   BLAST là một trong những chương trình được sử dụng rộng rãi nhất trong tin sinh học, có lẽ là vì nó giúp giải quyết một vấn đề cơ bản và giải thuật tập trung vào tốc độ hơn tính chính xác. Nó tập trung vào tốc độ vì đó là quyết định đến tính thực tiễn của giải thuật do cơ sở dữ liệu về genome người là cực kì lớn, mặc dù các giải thuật về sau có thể nhanh hơn.

   
Ba nguồn cơ sở dữ liệu công cộng lớn nhất về trình tự DNA và protein thường được gọi là ngân hàng gene (ngân hàng cơ sở dữ liệu gene) là NCBI, EMBL và DDBJ.

   Trong vài thập kỷ qua, sự phát triển nhanh chóng trong bộ gen và các công nghệ nghiên cứu phân tử và phát triển khác trong công nghệ thông tin đã kết hợp để tạo ra một lượng thông tin khổng lồ liên quan đến sinh học phân tử. Tin sinh học là tên được đặt cho các phương pháp toán học và điện toán được sử dụng để thu nhận sự hiểu biết về các quá trình sinh học.

   Tin sinh học hiện nay đòi hỏi phải tạo ra và tiến bộ cơ sở dữ liệu, thuật toán, kỹ thuật tính toán và thống kê và lý thuyết để giải quyết các vấn đề chính thức và thực tế phát sinh từ việc quản lý và phân tích dữ liệu sinh học. Ngoài ra việc đào tạo một đội ngũ chuyên gia về tin sinh học đương nhiên là điều quyết định cho sự thành công của sự phát triển tin sinh học.

Nếu quý khách quan tâm tới dịch vụ của chúng tôi:
Hãy liên hệ: (024) 3632 0328
Đặt dịch vụ
Đặt dịch vụ thành công
Dịch vụ khác