Skip to content

Projeto para revolucionar os exercícios de bioinformática na plataforma Rosalind, durante todos os dias de 2023.

Notifications You must be signed in to change notification settings

GuilhermeBPinheiro/Rosalind_Bioinfo_AllDay-2023

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 

Repository files navigation

Rosalind_Bioinfo_AllDay-2023

Badge em Desenvolvimento

Projeto para revolucionar os exercícios de bioinformática na plataforma Rosalind, durante todos os dias de 2023.


Plataforma Rosalind

image

Acesse a plataforma, clickando aqui --> Rosalind

Sumário


Apresentação a Plataforma: 🧬

O que é Bioinformática?

image

Bioinformática é um campo multidisciplinar, que corresponde à aplicações de ferramentas e técnicas de informáica, além de uma análise profunda de conceitos estatísticos, para analisar e resolver problemas da área da biologia molecular.

Quem foi a Rosalind Franklin?

image

Foi uma notável cientista britânica, que estudou diversos campos da química, física, fisioquímica e cristalografia de raios X. Falaceu muito jovem (aos 37 anos apenas), porém com inúmeros contribuições. Sendo a pioneira no estudo da biologia molecular, pelo qual empregou a técnica de difração dos raios-X, que favoreceu conhecer a estrutura do DNA como sendo helicoidal (estudo de 1949). Estuou a estrutura do carvão, grafite e dos vírus também, utilizando da técnica com uso de Raios-X, sendo um dos motivos de ter morrido tão cedo, pelo excesso de radiação. Apesar da descoberta da estrutura do DNA, esse reconhecimento não veio de imediato, sendo que provavelmente merecedora do Nobel. Em 2008, fora homenageada já falecida pelo o prêmio Louisa Gross Horwitz.

O que é Rosalind?

image

Rosalind é uma plataforma educacional web, que tem como objetivo principal propocional o aprendizado da Bioinformática, atraves da resoluções de diversos problemas e programação de computadores. O site foi lançado dia 25 de junho de 2012, é um site que pode ser usado de maneira totalmente gratuita e se mantem atualizado por meio da comunidade. É um projeto em conjunto entre a Universidade da Califórnia, San Diego e a Universidade Acadêmica de São Petersburgo, juntamente com a Academia Russa de Ciências. O nome do projeto homenageia Rosalind Franklin , cuja cristalografia de raios X com Raymond Gosling facilitou a "descoberta" da dupla hélice do DNA por James D. Watson e Francis Crick. Mais sobre a plataforma: Rosalind!


Objetivo:

image

Esse repositório tem como função, ser usado como plataforma de aprendizagem individual mostrando o progresso dentro da plataforma Rosalind. E servir como inspiração para que novas pessoas utilize e troque conhecimento entre si.


Metodologia:

Pré-requisitos obrigatórios:

Pré-requisitos opcionais:


Progresso

image

"Fortaleza da Bioinformática": descubra os algoritmos subjacentes a uma variedade de tópicos de bioinformática: espectrometria de massa computacional, alinhamento, programação dinâmica, montagem de genoma, rearranjos de genoma, filogenia, probabilidade, algoritmos de string e outros.

Glossário

  • Célula

A célula compõe todo organismo vivo na Terra, que varia desde de espécies unicelulares "simples" (ex.: vírus) até organismos pluricleulares complexos (ex.: Homo sapiens). Essas células reunidas formam estruturas progessivamente maiores e de maior complexicidade, e esse progressão possui um linear lógico.

Uma célula pequena não é vista a olho nú, todavia se une com outras e formar tecidos, estes se unem para formar orgãos e estes se unem para formar sistema, e sistemas unidos formam organismo, e a partir dai é possivel ir identificando estruturas a olho nú. Por isso, comumemente o apelido de células se deve ao fato de ser "bloco de construção de vida".

O interior da célula bacteriana é ativo, mas relativamente menos complexo do que o das células eucarióticas , que contêm uma coleção maior de subestruturas envoltas por membranas (chamadas organelas). As organelas alimentam uma ampla gama de funções celulares, desde a criação de proteínas até a regulação do conteúdo de água da célula. A organela eucariótica mais importante e proeminente é o núcleo , que serve como o cérebro central da célula, transmitindo informações genéticas para toda a célula por meio das instruções contidas no DNA.

De facto, esta estrutura em grelha foi observada aquando da descoberta das células em 1665 por Robert Hooke, que notou que as células de cortiça se assemelhavam às habitações habitadas pelos monges. Na figura abaixo, mostramos uma ilustração de células de cebola em diferentes estágios do ciclo celular, conforme desenhado por Edmund Wilson em 1900.

image

Figura 1 . Um desenho de 1900 por Edmund Wilson de células de cebola em diferentes estágios da mitose. A amostra foi tingida, fazendo com que a cromatina nas células (que absorve o corante) apareça em maior contraste com o resto da célula.

  • Núcleo

O núcleo, é uma das organelas presentes na célula, que serve como o centro cental das células eucarióticas. A função principal é abrigar o material genético (DNA) para fins de transcrição do RNA. Esse DNA é duplicado, junto com o restante do núcleo, durante a mitose. Visto sob um microscópio de luz, o núcleo geralmente aparece como uma região mais escura porque os ácidos nucléicos contidos no núcleo são compactados de forma tão densa. Por esta razão, o núcleo foi observado já em 1719 por Antonie van Leeuwenhoek, um polidor de lentes que ajudou a melhorar enormemente a tecnologia do microscópio.

Nem toda célula eucariótica contém um núcleo. Talvez o contra-exemplo mais citado sejam os glóbulos vermelhos de mamíferos, que não requerem organelas complicadas devido ao seu propósito relativamente simples de transportar oxigênio para os tecidos do corpo. No outro extremo do espectro, algumas células do fígado têm, na verdade, dois núcleos; no entanto, na maioria das vezes, a regra de uma célula/um núcleo é válida. Veja a figura abaixo para uma seção transversal ilustrada da estrutura nuclear.

image

  • Eucariontes

Os eucariotos compõem um dos três domínios da vida, sendo os outros dois Bacteria e Archaea. Considerando que os dois últimos domínios são restritos a organismos unicelulares , os eucariotos respondem por toda a vida multicelular na Terra (além de alguns organismos unicelulares também).

Veja a figura abaixo para uma seção transversal de uma célula eucariótica típica. A característica definidora dos eucariotos é que suas células contêm organelas complexas envoltas em membranas, em particular o núcleo celular. Essas organelas facilitam uma espécie de divisão de trabalho, que é o que permite à célula realizar tarefas relativamente complexas e facilitou o salto milagroso dos eucariotos de espécies unicelulares para organismos multicelulares mais complexos.

image

Tópico String Algorithms

1. Counting DNA Nucleotides

1 de Junho de 2012 às 21:00 by Rosalind Team

13 de Março de 2023 às .... by Guiherme Bueno - Concluída.

Descrição:

Introdução à Biologia Molecular

Todo material vivo tem como unidade básica a célula, sendo esta considerada o bloco de construção da vida. A célula possui o núcleo (uma organela), que está presente na maioria das células erucarióticas, e fora identificado como dentro da atividade celular há 150 anos atrás.

isto ao microscópio de luz, o núcleo aparece apenas como uma região mais escura da célula, mas à medida que aumentamos a ampliação, descobrimos que o núcleo é densamente preenchido por uma mistura de macromoléculas chamadas cromatina. Durante a mitose (divisão celular eucariótica), a maior parte da cromatina se condensa em longas e finas cadeias chamadas cromossomos.

Veja a Figura 1 para uma figura de células em diferentes estágios de mitose.

image

Figura 1 . Um desenho de 1900 por Edmund Wilson de células de cebola em diferentes estágios da mitose. A amostra foi tingida, fazendo com que a cromatina nas células (que absorve o corante) apareça em maior contraste com o resto da célula.

Uma classe de macromoléculas contidas na cromatina são chamadas de ácidos nucléicos. A pesquisa do início do século 20 sobre a identidade química dos ácidos nucléicos culminou com a conclusão de que os ácidos nucléicos são polímeros, ou cadeias repetidas de moléculas menores e estruturadas de maneira semelhante, conhecidas como monômeros. Devido à sua tendência de serem longos e finos, os polímeros de ácido nucleico são comumente chamados de filamentos.

O monômero de ácido nucleico é chamado de nucleotídeo e é usado como uma unidade de comprimento de fita (abreviado para nt). Cada nucleotídeo é formado por três partes: uma molécula de açúcar , um íon carregado negativamente chamado fosfato e um composto chamado nucleobase ("base" para abreviar).

A polimerização é alcançada quando o açúcar de um nucleotídeo se liga ao fosfato do próximo nucleotídeo na cadeia, que forma um esqueleto de açúcar-fosfatopara a cadeia de ácido nucleico. Um ponto-chave é que os nucleotídeos de um tipo específico de ácido nucléico sempre contêm as mesmas moléculas de açúcar e fosfato e diferem apenas na escolha da base. Assim, uma fita de um ácido nucléico pode ser diferenciada de outra com base apenas na ordem de suas bases; esta ordenação de bases define a estrutura primária de um ácido nucléico.

Por exemplo, a Figura 2 mostra uma fita de ácido nucléico desoxirribose (DNA), na qual o açúcar é chamado de desoxirribose , e as únicas quatro opções para nucleobases são moléculas chamadas adenina (A), citosina (C), guanina (G) e timina (T).

image

Figura 2 . Um esboço da estrutura primária do DNA.

Por razões que veremos em breve, o DNA é encontrado em todos os organismos vivos da Terra, incluindo as bactérias; é até encontrado em muitos vírus (que muitas vezes são considerados não vivos). Devido à sua importância, reservamos o termo genoma para nos referirmos à soma total do DNA contido nos cromossomos de um organismo.

Problema:

Uma string é simplesmente uma coleção ordenada de símbolos selecionados de algum alfabeto e formandos em uma palavra; o comprimento de uma string é o número de símbiolos que ela contem. Um exemplo de cadeia de DNA de comrpimento 21 (cujo alfabeto contém os símbiolos 'A', 'C', 'G' e 'T') é "ATGCTTCAGAAAGGTCTTACG".

  • Dado: Uma cadeia de DNA "s" de comprimento no máximo 1000 nt.
  • Retorno: Quatro inteiros (separados por espaços) contando o respectivo número de vezes que os símbiolos "A", "C", "G" e "T" ocorrem em "s".

Esperado:

  • Conjunto de dados de amsotra:
AGCTTTTCATTCTGACTGCAACGGGCAATATGTCTCTGTGTGGATTAAAAAAAGAGTGTCTGATAGCAGC
  • Saída de Amostra:
20 12 17 21

Exemplo:

Baixar e/ou abrir arquivo rosalind_dna.txt no ambiente de desenvolvimento do seu código. Ex.: Google Colab, IDLE, Terminal.

  • Use o seguinte código:
from google.colab import files
rosalind_DNA = files.upload()
  • Veja que tem dentro do arquivo:
!cat /content/rosalind_dna.txt
  • Código para resolver problema (com duas opções):
# Ler o arquivo e armazenar a string numa varíavel.
arquivo = open("/content/rosalind_dna.txt", 'r')
DNA = arquivo.read()
import fileinput #Pode usar isso para importar arquivo 

# Imprime o dados originais do arquivo base.
print (DNA)

# 1 Opção - Função ".count()".
DNA_A = DNA.count("A")
DNA_C = DNA.count("C")
DNA_G = DNA.count("G")
DNA_T = DNA.count("T")

'''
# 2 Opção - Laço "for".
for sequence in fileinput.input('/content/rosalind_dna.txt'):
  dna_count_a = 0
  dna_count_c = 0
  dna_count_g = 0
  dna_count_t = 0
  for base in sequence:
    if base == "A":
      dna_count_a += 1
    elif base == "C":
      dna_count_c += 1
    elif base == "G":
      dna_count_g += 1
    elif base == "T":
      dna_count_t += 1
'''
# Imprime as contagens de simbolos correspondente as bases de DNA.
print(DNA_A, DNA_C, DNA_G, DNA_T) #Opção 1
#print(dna_count_a, dna_count_c, dna_count_g, dna_count_t) #Opção 2

About

Projeto para revolucionar os exercícios de bioinformática na plataforma Rosalind, durante todos os dias de 2023.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published