Gene BAS5037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS5037
Symbol
ID	2852000
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	-
Start bp	4908448
End bp	4909428
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	40%
IMG OID	637508292
Product	peptide chain release factor 2
Protein accession	YP_031276
Protein GI	49188023
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG1186] Protein chain release factor B
TIGRFAM ID	[TIGR00020] peptide chain release factor 2

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGGGCG CAGGATTTTG GGATGACCAA CAAGGCGCAC AAGCTGTAAT TAATGAAGCG 
AATGCACTGA AAGATATGGT TGGAAAGTTC CGTCAGCTAG ATGAGACGTT CGAGAATCTA 
GAAATTACGC ATGAGCTTTT AAAAGAAGAG TATGATGAAG ATTTACATGA GGAGCTTGAA 
TCAGAAGTAA AAGGTTTAAT TCAAGAAATG AATGAGTATG AACTTCAGTT ACTACTTAGC 
GATCCTTATG ATAAAAATAA AGCGATTTTA GAATTACACC CAGGTGCTGG TGGAACAGAG 
TCACAAGACT GGGGCTCTAT GTTACTACGT ATGTACACAC GTTGGGCTGA AAAACGTGGA 
TTTAAAGTAG AAACAGTTGA CTACTTACCA GGTGATGAAG CTGGTATTAA GAGTGTTACG 
TTATTAATTA AAGGTCATAA CGCTTACGGT TACTTAAAGG CAGAGAAAGG TGTACATCGT 
CTTGTACGTA TTTCTCCATT CGATTCTTCA GGCCGTCGCC ATACATCGTT CGTATCTTGT 
GAAGTTGTAC CTGAGTTCAA TGATGAAGTT GAAATTGAAG TGCGTACAGA AGACTTGAAA 
ATTGATACGT ATCGTGCAAG TGGAGCTGGT GGACAGCACG TTAATACGAC AGATTCAGCA 
GTTCGTATTA CGCATACGCC GACAAATACG GTTGTAACGT GTCAGTCAGA GCGTTCTCAA 
ATTAAAAACC GTGAGCATGC GATGAAGATG TTAAAAGCGA AATTATATCA AAAGAAATTA 
GAAGAGCAAC AAGCGGAGTT AGATGAAATT CGCGGAGAAC AAAAGGAAAT TGGATGGGGT 
AGTCAAATCC GTTCTTACGT ATTCCACCCG TATTCTCTTG TGAAAGACCA CCGTACAAAT 
ACAGAGGTCG GTAACGTGCA AGCAGTTATG GATGGAGAAA TTGACCCATT CATTGATGCT 
TACTTACGTT CTCGCATCTA A

Protein sequence

MMGAGFWDDQ QGAQAVINEA NALKDMVGKF RQLDETFENL EITHELLKEE YDEDLHEELE 
SEVKGLIQEM NEYELQLLLS DPYDKNKAIL ELHPGAGGTE SQDWGSMLLR MYTRWAEKRG 
FKVETVDYLP GDEAGIKSVT LLIKGHNAYG YLKAEKGVHR LVRISPFDSS GRRHTSFVSC 
EVVPEFNDEV EIEVRTEDLK IDTYRASGAG GQHVNTTDSA VRITHTPTNT VVTCQSERSQ 
IKNREHAMKM LKAKLYQKKL EEQQAELDEI RGEQKEIGWG SQIRSYVFHP YSLVKDHRTN 
TEVGNVQAVM DGEIDPFIDA YLRSRI