Gene BAS2037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS2037
Symbol
ID	2849061
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	+
Start bp	2047477
End bp	2048883
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	36%
IMG OID	637505287
Product	hypothetical protein
Protein accession	YP_028300
Protein GI	49185048
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.107274
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGATTCC GACCAGAAGT AGGAGAAAAA ATTAGTCTGA ATAAAGATGT TTATCGTTTT 
GAGAAACACC CAGCTGTAAT TGGTATTGAA ATGCCGTATG GGCAAGAAGG TAGACAAGGA 
ACAGTCTATC AACTGCAACA TGAAAATGGC ATGGAACGAA TTGCATTAAA AGTTTTTAAG 
GAACGCTATC GCGAGGAAAA ACATCAACTA GCATTTTTGA AACCACTTTC TTCCATAGCG 
GGTCTTAAAG TATGTTCACG CTATATCGTT ACTAAAGAAG AACATATATC TGCTATCGAA 
AAATCAGAAG ACCTTGCTAA TAGTATTGTA ATGCCTTGGG TTGAAGGACC AACTTGGGCT 
GATATTTTAC AAGAACAACG AATGTTATCA AAAGAACAAT GCTTCTTTAT TGCAGAAGCA 
TTTCTTACAA CACTTAAAAT GATGGAGGAA AATGAAGTTG CTCATAATGA TTTATCGTCT 
AGCAACGTAC TCATACCTTT CTTAAGTGAA AATCCAATTG AAGGCCAACA CTATATCGAA 
CTTGTTGATG TTGAGCAAAT GTATGGTCCA AAAACGAAAA GACCTTCGTT ATTGCCAGCA 
GGTTCAGCGG GTTACGCACC AATGTATTTA AAAAGTGGAG TATGGCAAAA AGAAGCTGAT 
CGATTTGCAG GTGCCATTTT ATTAGGAGAA ATATTGAGTT GGTGTAGTGA AGAAGTTCGA 
AATAAAAAAT GGACGGATGC AAGTTACTTT AAAACGGAAG AAATGCAGAA AGAATGTGAA 
AGATATACGT TACTTCAGCA AGTATTACAT AATCAATGGA ATGGGGAAAT TGCAAAATTA 
TTTAAGCAGG CATGGAGTAG TAACTCTTTC GCAGAATGCC CGAGCTTTGC ACAGTGGTAC 
GATGTATTTC ATAGCGTGAG AGAAAGAATA AAAATTGATG CGGAAAGGCA GTTAGCAGAA 
GAACACTCTC TTTTTGTATC AAAATGTTTG GAAATTGCAA GATTATTAGA AGAGAGAGGA 
TTTAAACAAG CGGCATTATA TGAGTATAAA ATAATTTTCA ATTCACTCAA TCCATCAACA 
GCTCTGCAAA AAGAACTCGC ATATATCATT CAAACTATGG AGAGTCAAGA GCCTGAAATA 
AATAAAAAAA TGGTCCTACA ACATTATTTG GAATTAGCTA CTGAATTGGA ACGAGAAAAC 
AATGCAGCAT TTGCTTGTTT CGTCTATTCA CGAATCGTAC AATTTCCAAA CATTGATCAG 
GCGTTAAAAC AGGAAATTGC AAGCATTATT GAAGAGATAA AAGAAGGGCA AGGAACAGAG 
ACGCAGCAAG AAGTAGCAGC TACAATTACA GTTCCAAATA GTATTCTACA GAGCCGGAAA 
AAAAACGAAA AAACAAGTGG AATATGA

Protein sequence

MGFRPEVGEK ISLNKDVYRF EKHPAVIGIE MPYGQEGRQG TVYQLQHENG MERIALKVFK 
ERYREEKHQL AFLKPLSSIA GLKVCSRYIV TKEEHISAIE KSEDLANSIV MPWVEGPTWA 
DILQEQRMLS KEQCFFIAEA FLTTLKMMEE NEVAHNDLSS SNVLIPFLSE NPIEGQHYIE 
LVDVEQMYGP KTKRPSLLPA GSAGYAPMYL KSGVWQKEAD RFAGAILLGE ILSWCSEEVR 
NKKWTDASYF KTEEMQKECE RYTLLQQVLH NQWNGEIAKL FKQAWSSNSF AECPSFAQWY 
DVFHSVRERI KIDAERQLAE EHSLFVSKCL EIARLLEERG FKQAALYEYK IIFNSLNPST 
ALQKELAYII QTMESQEPEI NKKMVLQHYL ELATELEREN NAAFACFVYS RIVQFPNIDQ 
ALKQEIASII EEIKEGQGTE TQQEVAATIT VPNSILQSRK KNEKTSGI