Gene BAS5208 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS5208
Symbol
ID	2848838
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	+
Start bp	5097244
End bp	5098644
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	39%
IMG OID	637508463
Product	aminopeptidase
Protein accession	YP_031447
Protein GI	49188194
COG category	[R] General function prediction only
COG ID	[COG2234] Predicted aminopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0274505
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAT CTTTGAAACA AAAAATAGTA AGCTCCTTGC TTGCTGTATC ACTCGCTGTT 
AGCTTAGCTC CGATTGGACA AGCTAACGCT GATTCCACGT CAGAAATCAA GCAGACTTCA 
TCTATCACAA AACAAGTTGA TGCAAGCCGC GCTATCGAAC ACATCCGTTT CTTATCCGAA 
ACAATTGGTC CTCGACCTGG TGGGACAAAA TCAGAAGAAT GGGCTTCTCG CTACGTTGGT 
ATGCAGCTTA AATCAATGGG CTACGAAGTA GAATATCAAC CATTTCAAGT GCCGGATCAA 
TACGTTGGAT TTATTGAATC ACCATTATCC ACAAAGCGTA ATTGGCAAAC TGGTGCTGCC 
CCTAATGCAC TAATTTCTAC AGAATCTGTT ACAGCTCCTC TTATCTTTGT TCAAGGTGGG 
ACAAAATTAG AGGATATCCC AAATGAAGTA AATGGAAAAA TTGTTCTATT CGAAAGAGGA 
ACAACAGTAG CTGACTATAA TAAACAAGTT GAAAATGCTG TTAGCAAAGG AGCAAAAGGT 
GTTCTTTTAT ACAGTTTAAT TGGTGGACGT GGAAACTACG GACAAACTTT CAATCCCCGC 
CTAACGAAAA AGCAATCTAT CCCTGTCTTT GGTCTTGCTT ATGCGCAAGG AAATGCATTT 
AAAGAAGAAA TCGCTAAAAA AGGAACAACA ATTCTTTCCC TAAAAGCGAG ACATGAATCT 
AATTTAACAT CATTAAACGT CATCGCTAAA AAGAAACCAA AAAACAGTAC AGGTAATGAA 
AAAGCTGTCG TTGTAAGCTC ACACTACGAT AGTGTCGTTG GAGCACCTGG AGCAAATGAT 
AATGCTTCTG GTACAGGATT AGTATTAGAA TTAGCTCGTG CTTTTCAAAA TGTAGAAACT 
GATAAAGAAA TTCGTTTTAT TGCTTTTGGT TCTGAAGAGA CTGGCTTACT TGGCTCCGAT 
TATTACGTTA ATAGCTTATC CCCAAAAGAA CGCGATCGAA TTTTAGGTGT CTTTAACGCA 
GACATGGTCG CAACAAATTA CGATAAAGCA AAGAATTTAT ATGCTATGAT GCCTAACGGT 
TCTCCAAACC TTGTAACAGA CGCAGCCTTA CAAGCAGGTA AACAATTAAA TAATGACCTC 
GTTCTGCAAG GGAAATTTGG CTCTAGTGAT CACGTACCGT TTGCTGAAGT TGGTATTCCT 
GCGGCTCTAT TTATTTGGAT GGGTGTCGAT AGTTGGAATC CATTAATCTA CCATATCGAA 
AAGGTATATC ACACACCTCA AGATAACGTA TTTGAGAATA TTTCACCTGA ACGTATGAAA 
ATGGCACTAG AAGTAATCGG AACTGGTGTT TATAACACTC TTCAACAATC TGTTACGCAA 
ACAGAACAGA AAGCTGCTTA A

Protein sequence

MKKSLKQKIV SSLLAVSLAV SLAPIGQANA DSTSEIKQTS SITKQVDASR AIEHIRFLSE 
TIGPRPGGTK SEEWASRYVG MQLKSMGYEV EYQPFQVPDQ YVGFIESPLS TKRNWQTGAA 
PNALISTESV TAPLIFVQGG TKLEDIPNEV NGKIVLFERG TTVADYNKQV ENAVSKGAKG 
VLLYSLIGGR GNYGQTFNPR LTKKQSIPVF GLAYAQGNAF KEEIAKKGTT ILSLKARHES 
NLTSLNVIAK KKPKNSTGNE KAVVVSSHYD SVVGAPGAND NASGTGLVLE LARAFQNVET 
DKEIRFIAFG SEETGLLGSD YYVNSLSPKE RDRILGVFNA DMVATNYDKA KNLYAMMPNG 
SPNLVTDAAL QAGKQLNNDL VLQGKFGSSD HVPFAEVGIP AALFIWMGVD SWNPLIYHIE 
KVYHTPQDNV FENISPERMK MALEVIGTGV YNTLQQSVTQ TEQKAA