Projeto para revolucionar os exercícios de bioinformática na plataforma Rosalind, durante todos os dias de 2023.
Acesse a plataforma, clickando aqui --> Rosalind
- 1. Apresentação a Plataforma
- 2. Objetivo
- 3. Metodologia
- 3.1. Pré-requisitos obrigatórios
- 3.2. Pré-requisitos opcionais
- 4. Progresso
- 7. Contatos
Foi uma notável cientista britânica, que estudou diversos campos da química, física, fisioquímica e cristalografia de raios X. Falaceu muito jovem (aos 37 anos apenas), porém com inúmeros contribuições. Sendo a pioneira no estudo da biologia molecular, pelo qual empregou a técnica de difração dos raios-X, que favoreceu conhecer a estrutura do DNA como sendo helicoidal (estudo de 1949). Estuou a estrutura do carvão, grafite e dos vírus também, utilizando da técnica com uso de Raios-X, sendo um dos motivos de ter morrido tão cedo, pelo excesso de radiação. Apesar da descoberta da estrutura do DNA, esse reconhecimento não veio de imediato, sendo que provavelmente merecedora do Nobel. Em 2008, fora homenageada já falecida pelo o prêmio Louisa Gross Horwitz.
Rosalind é uma plataforma educacional web, que tem como objetivo principal propocional o aprendizado da Bioinformática, atraves da resoluções de diversos problemas e programação de computadores. O site foi lançado dia 25 de junho de 2012, é um site que pode ser usado de maneira totalmente gratuita e se mantem atualizado por meio da comunidade. É um projeto em conjunto entre a Universidade da Califórnia, San Diego e a Universidade Acadêmica de São Petersburgo, juntamente com a Academia Russa de Ciências. O nome do projeto homenageia Rosalind Franklin , cuja cristalografia de raios X com Raymond Gosling facilitou a "descoberta" da dupla hélice do DNA por James D. Watson e Francis Crick. Mais sobre a plataforma: Rosalind!
"Fortaleza da Bioinformática": descubra os algoritmos subjacentes a uma variedade de tópicos de bioinformática: espectrometria de massa computacional, alinhamento, programação dinâmica, montagem de genoma, rearranjos de genoma, filogenia, probabilidade, algoritmos de string e outros.
- Célula
A célula compõe todo organismo vivo na Terra, que varia desde de espécies unicelulares "simples" (ex.: vírus) até organismos pluricleulares complexos (ex.: Homo sapiens). Essas células reunidas formam estruturas progessivamente maiores e de maior complexicidade, e esse progressão possui um linear lógico.
Uma célula pequena não é vista a olho nú, todavia se une com outras e formar tecidos, estes se unem para formar orgãos e estes se unem para formar sistema, e sistemas unidos formam organismo, e a partir dai é possivel ir identificando estruturas a olho nú. Por isso, comumemente o apelido de células se deve ao fato de ser "bloco de construção de vida".
O interior da célula bacteriana é ativo, mas relativamente menos complexo do que o das células eucarióticas , que contêm uma coleção maior de subestruturas envoltas por membranas (chamadas organelas). As organelas alimentam uma ampla gama de funções celulares, desde a criação de proteínas até a regulação do conteúdo de água da célula. A organela eucariótica mais importante e proeminente é o núcleo , que serve como o cérebro central da célula, transmitindo informações genéticas para toda a célula por meio das instruções contidas no DNA.
De facto, esta estrutura em grelha foi observada aquando da descoberta das células em 1665 por Robert Hooke, que notou que as células de cortiça se assemelhavam às habitações habitadas pelos monges. Na figura abaixo, mostramos uma ilustração de células de cebola em diferentes estágios do ciclo celular, conforme desenhado por Edmund Wilson em 1900.
Figura 1 . Um desenho de 1900 por Edmund Wilson de células de cebola em diferentes estágios da mitose. A amostra foi tingida, fazendo com que a cromatina nas células (que absorve o corante) apareça em maior contraste com o resto da célula.
- Núcleo
O núcleo, é uma das organelas presentes na célula, que serve como o centro cental das células eucarióticas. A função principal é abrigar o material genético (DNA) para fins de transcrição do RNA. Esse DNA é duplicado, junto com o restante do núcleo, durante a mitose. Visto sob um microscópio de luz, o núcleo geralmente aparece como uma região mais escura porque os ácidos nucléicos contidos no núcleo são compactados de forma tão densa. Por esta razão, o núcleo foi observado já em 1719 por Antonie van Leeuwenhoek, um polidor de lentes que ajudou a melhorar enormemente a tecnologia do microscópio.
Nem toda célula eucariótica contém um núcleo. Talvez o contra-exemplo mais citado sejam os glóbulos vermelhos de mamíferos, que não requerem organelas complicadas devido ao seu propósito relativamente simples de transportar oxigênio para os tecidos do corpo. No outro extremo do espectro, algumas células do fígado têm, na verdade, dois núcleos; no entanto, na maioria das vezes, a regra de uma célula/um núcleo é válida. Veja a figura abaixo para uma seção transversal ilustrada da estrutura nuclear.
- Eucariontes
Os eucariotos compõem um dos três domínios da vida, sendo os outros dois Bacteria e Archaea. Considerando que os dois últimos domínios são restritos a organismos unicelulares , os eucariotos respondem por toda a vida multicelular na Terra (além de alguns organismos unicelulares também).
Veja a figura abaixo para uma seção transversal de uma célula eucariótica típica. A característica definidora dos eucariotos é que suas células contêm organelas complexas envoltas em membranas, em particular o núcleo celular. Essas organelas facilitam uma espécie de divisão de trabalho, que é o que permite à célula realizar tarefas relativamente complexas e facilitou o salto milagroso dos eucariotos de espécies unicelulares para organismos multicelulares mais complexos.
1 de Junho de 2012 às 21:00 by Rosalind Team
13 de Março de 2023 às .... by Guiherme Bueno - Concluída.
Descrição:
Introdução à Biologia Molecular
Todo material vivo tem como unidade básica a célula, sendo esta considerada o bloco de construção da vida. A célula possui o núcleo (uma organela), que está presente na maioria das células erucarióticas, e fora identificado como dentro da atividade celular há 150 anos atrás.
isto ao microscópio de luz, o núcleo aparece apenas como uma região mais escura da célula, mas à medida que aumentamos a ampliação, descobrimos que o núcleo é densamente preenchido por uma mistura de macromoléculas chamadas cromatina. Durante a mitose (divisão celular eucariótica), a maior parte da cromatina se condensa em longas e finas cadeias chamadas cromossomos.
Veja a Figura 1 para uma figura de células em diferentes estágios de mitose.
Figura 1 . Um desenho de 1900 por Edmund Wilson de células de cebola em diferentes estágios da mitose. A amostra foi tingida, fazendo com que a cromatina nas células (que absorve o corante) apareça em maior contraste com o resto da célula.
Uma classe de macromoléculas contidas na cromatina são chamadas de ácidos nucléicos. A pesquisa do início do século 20 sobre a identidade química dos ácidos nucléicos culminou com a conclusão de que os ácidos nucléicos são polímeros, ou cadeias repetidas de moléculas menores e estruturadas de maneira semelhante, conhecidas como monômeros. Devido à sua tendência de serem longos e finos, os polímeros de ácido nucleico são comumente chamados de filamentos.
O monômero de ácido nucleico é chamado de nucleotídeo e é usado como uma unidade de comprimento de fita (abreviado para nt). Cada nucleotídeo é formado por três partes: uma molécula de açúcar , um íon carregado negativamente chamado fosfato e um composto chamado nucleobase ("base" para abreviar).
A polimerização é alcançada quando o açúcar de um nucleotídeo se liga ao fosfato do próximo nucleotídeo na cadeia, que forma um esqueleto de açúcar-fosfatopara a cadeia de ácido nucleico. Um ponto-chave é que os nucleotídeos de um tipo específico de ácido nucléico sempre contêm as mesmas moléculas de açúcar e fosfato e diferem apenas na escolha da base. Assim, uma fita de um ácido nucléico pode ser diferenciada de outra com base apenas na ordem de suas bases; esta ordenação de bases define a estrutura primária de um ácido nucléico.
Por exemplo, a Figura 2 mostra uma fita de ácido nucléico desoxirribose (DNA), na qual o açúcar é chamado de desoxirribose , e as únicas quatro opções para nucleobases são moléculas chamadas adenina (A), citosina (C), guanina (G) e timina (T).
Figura 2 . Um esboço da estrutura primária do DNA.
Por razões que veremos em breve, o DNA é encontrado em todos os organismos vivos da Terra, incluindo as bactérias; é até encontrado em muitos vírus (que muitas vezes são considerados não vivos). Devido à sua importância, reservamos o termo genoma para nos referirmos à soma total do DNA contido nos cromossomos de um organismo.
Problema:
Uma string é simplesmente uma coleção ordenada de símbolos selecionados de algum alfabeto e formandos em uma palavra; o comprimento de uma string é o número de símbiolos que ela contem. Um exemplo de cadeia de DNA de comrpimento 21 (cujo alfabeto contém os símbiolos 'A', 'C', 'G' e 'T') é "ATGCTTCAGAAAGGTCTTACG".
- Dado: Uma cadeia de DNA "s" de comprimento no máximo 1000 nt.
- Retorno: Quatro inteiros (separados por espaços) contando o respectivo número de vezes que os símbiolos "A", "C", "G" e "T" ocorrem em "s".
Esperado:
- Conjunto de dados de amsotra:
AGCTTTTCATTCTGACTGCAACGGGCAATATGTCTCTGTGTGGATTAAAAAAAGAGTGTCTGATAGCAGC
- Saída de Amostra:
20 12 17 21
Exemplo:
Baixar e/ou abrir arquivo rosalind_dna.txt no ambiente de desenvolvimento do seu código. Ex.: Google Colab, IDLE, Terminal.
- Use o seguinte código:
from google.colab import files
rosalind_DNA = files.upload()
- Veja que tem dentro do arquivo:
!cat /content/rosalind_dna.txt
- Código para resolver problema (com duas opções):
# Ler o arquivo e armazenar a string numa varíavel.
arquivo = open("/content/rosalind_dna.txt", 'r')
DNA = arquivo.read()
import fileinput #Pode usar isso para importar arquivo
# Imprime o dados originais do arquivo base.
print (DNA)
# 1 Opção - Função ".count()".
DNA_A = DNA.count("A")
DNA_C = DNA.count("C")
DNA_G = DNA.count("G")
DNA_T = DNA.count("T")
'''
# 2 Opção - Laço "for".
for sequence in fileinput.input('/content/rosalind_dna.txt'):
dna_count_a = 0
dna_count_c = 0
dna_count_g = 0
dna_count_t = 0
for base in sequence:
if base == "A":
dna_count_a += 1
elif base == "C":
dna_count_c += 1
elif base == "G":
dna_count_g += 1
elif base == "T":
dna_count_t += 1
'''
# Imprime as contagens de simbolos correspondente as bases de DNA.
print(DNA_A, DNA_C, DNA_G, DNA_T) #Opção 1
#print(dna_count_a, dna_count_c, dna_count_g, dna_count_t) #Opção 2