Gene BAS5066 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS5066
Symbol
ID	2849287
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	+
Start bp	4940459
End bp	4941616
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	34%
IMG OID	637508321
Product	hypothetical protein
Protein accession	YP_031305
Protein GI	49188052
COG category	[S] Function unknown
COG ID	[COG3274] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTCAAA GCGCACCAGA ATTTAAAGTT TTGCAAAGCA TTGCATTCCT TGCTGTCGTT 
TTGCAAAGTT CGTTATTATA TACAATGAAT CAAGGAAATG TCTTACTTGA GCAATCTCTC 
ATTATGGGCA TGCTATTTAA CCTTGCAAAA TTTTCGGCAC CTGCATTCAT ATTTATCGTT 
GGATTTCATT TAATTCGTCA CTATACAAAG CAATTAGTAT ACAAAGAATA TATTTCTGAA 
AAAGCCGCAC ATTTACTCAT TCCTTATTTC TTCTGGTCTA TTCTTTACTT ATTAACAACA 
AACGATATGA TCACATTACA AGGCGGAATA AAAAGTGTAT TACTCGGAAC GGCTGCACCT 
CACCTTTGGT ACGTAATTAT GATGTTCCAA ATTCACTTAT TGTTCCCTTT GCTGTGCACA 
CTATTTTATT GGTTTCAAAA ACGAACAGAA AATAAAAAAG ACATATATAA ATATATGACC 
ATCTTTGCTT GTCTATATTT CCTCTTAATG TGGTATTCTT CGCACTACAT TTTTAATGGA 
GAGAAATTGA CTAGCTCAAC CATTTTACAT TATACAGATC GTTCCTTCTT CTTCTATTCG 
TTCTATTTCG TCATGGGAGG AATCGCTGCT GTAGCACTAA AAACATGGCG GCTATTCGTC 
ATGAAACATA TCCCGCTTAT CACAATCTTA TTTTTCATCT TATTTTTATT CATCAATTAT 
GAGTTATTTA GTTTTTACGG CGCAAACTCT ATTCATTTAA CCGTTTCGAC TTATTTAAAA 
CCGTCTATGT TTTTATATAT CGTATGCGAA ATTATTATAC TTTACGTGCT TTCTATTACA 
ATCGTACAGC GACGCGGTTT CTTATATAAA GCTTTACGAT TTATCGGGAA TTACACGTAT 
GGTGCTTATT TAGCTCACTT TTTCTTCTTG CAACTATGTA CAAAGTTTCT TTCTTTATTC 
ACACTGCAAG AAAACACAAT ATTATATAGC TTATTATTAT TTACAATAAC GGCTACAATC 
TCAATTTCAG CAATGGTCCT TTGTAGTACA CTACCATTTC ATACGTGGAT TACAGGACCG 
TCTCCTAGGG CAACTGTGAG ATGGGCGAAG ATCGTACTTC GGAAACATCA TGAAAAAGTA 
TGTAAACCAT ATCTTTGA

Protein sequence

MTQSAPEFKV LQSIAFLAVV LQSSLLYTMN QGNVLLEQSL IMGMLFNLAK FSAPAFIFIV 
GFHLIRHYTK QLVYKEYISE KAAHLLIPYF FWSILYLLTT NDMITLQGGI KSVLLGTAAP 
HLWYVIMMFQ IHLLFPLLCT LFYWFQKRTE NKKDIYKYMT IFACLYFLLM WYSSHYIFNG 
EKLTSSTILH YTDRSFFFYS FYFVMGGIAA VALKTWRLFV MKHIPLITIL FFILFLFINY 
ELFSFYGANS IHLTVSTYLK PSMFLYIVCE IIILYVLSIT IVQRRGFLYK ALRFIGNYTY 
GAYLAHFFFL QLCTKFLSLF TLQENTILYS LLLFTITATI SISAMVLCST LPFHTWITGP 
SPRATVRWAK IVLRKHHEKV CKPYL