Gene BAS2687 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS2687
Symbol
ID	2848924
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	-
Start bp	2668447
End bp	2670183
Gene Length	1737 bp
Protein Length	578 aa
Translation table	11
GC content	33%
IMG OID	637505932
Product	solute-binding family 5 protein
Protein accession	YP_028945
Protein GI	49185693
COG category	[R] General function prediction only
COG ID	[COG4533] ABC-type uncharacterized transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.240712
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTATTT TAGATCAATA TATTGAACTA TGGTGTGCCT ATGGTAAAGG GAGACAAGAA 
GGCGAACAAT TTGAAGTAAC AGTACAAATG ATTGCAGAAA CATTATTTTG TACAGAACGT 
AATAGTAAAT TAATTATCAA AAAGTTAGAT GAATTAAATT GGATTGCTTG GTTTCCAGGG 
CGCGGAAGAG GGAATCGTTC TAAATTAATA TTTAAAAAGC AACCAATGAC ATTAATTTTA 
GACAGAGGAA AAGAACTAAC GAAAAAAGGG GATGTAAAAA GCGGAATTTC ATTTGTGAAA 
CGCTATAGCT CACAATTTCC GTCAGTAAAG GAAGAGTATG AAGTTTGGAT AGATTCAATA 
TTTGGTCATA AAATAGAAAG GACATCCGAA GGGAGAAGAG ATGTACTTCG TTTGCAGGTT 
CAAATGAATT TAGATATTGC ATTAGATCCG GTCTACGCTA CAATGCGATC AGAATGTCAT 
ATGGTTAAAC ATATTTTTGA TACACTCGTA TATGTAAATG AGGAATCAAA CTATATAGAA 
CCAAGGCTAG CTTTTCAATG GGAATATAAT GATGCAGAAA AGATATGGAC GTTTTATTTA 
CGAAAAGGAG TTCACTTTCA TAATAGGAAA CAACTTACTG CACATGATGT TATACATTCA 
TGGAATCGAT TTATGAAAGC TGAAAATAAC CCACATGCGT GGATGTTACA ACATATTGAA 
AGCTTCCGCG CAGTAGATGA ATATGTTATT GAAATTCAGT TACGTACGGA AAATAGGATG 
TTTTTACATA TGATAAGTGC AGAACAGTGT TCTATCGTAA AGGAAGATGA AGCACGAAAC 
CTCATTGGAA CAGGCCCCTT TAAATTAAGC GAAAAGAATG CACATTTATT TGTATTGGAA 
GCACATGATT TATATTATCG TGAAAGATCT TTTCTTGACC GAATTGAACT ATTGAATGTA 
GAACAAAGTG TAAATACATA CGATATTTTA GTAAAGGCGC AGTATAAAGA TAAAGAAAAA 
CATAATAAAG AATTATCTCG GCTTGAGTCG AACGTGACAT ATATAACATG CAATCTTGCA 
AAAGAAGGAT CAATGCAAGA TTATATGTTC CGAAAAGCGT TATATAAAAT CATTCATGGC 
CAAGCAATCG TTCAAGAACT CGGTGGAGAA CGTGGAGAAG TGGCAAAGGA AATACTATTA 
GCTAGTGACA GTATAGTAGA GATTGAGGAA GATATAGAAA GTTTAATTAA AGAAAGTATG 
TATCAAAATG AAGTGCTACA ACTTTACACA TTTACAGGAC AAGATCATGT AGAAGATGCG 
CAATGGATAC AAAAAGAGTG TGCGAAGTAC GGTATTCGTG TAGAAAATAA TTTTCTTGAA 
ATAGAAGAGT TATTGGAAAT AAATACGATA CAAAAGGCTG ATATGATGCA TGATAGTGCA 
ACGATTAGCG AACGAATAGA AGATAGTCTA CTATACATGT TTCTTACAAA AAATAGTTTT 
ATTCATGGGC AAAGCAGCAT GGACTTTCAT GCAACGTTAT CTCCTTATTT CAAACTAGAA 
CAAGTAGAGA ATAGAGTTAC ACTGTTACGC GATATTGAGG ACACATTGTT ACGTCAAATT 
CATGTTATTC CTTTATATCG CAACAAACAA CAAGTAACTT CTCATGAAAA AGTACAAAAT 
ATAATGATTA ATTCACAAGG GTGGATCGAT TTTTATAAAA TATGGTTTAA ACCCTGA

Protein sequence

MFILDQYIEL WCAYGKGRQE GEQFEVTVQM IAETLFCTER NSKLIIKKLD ELNWIAWFPG 
RGRGNRSKLI FKKQPMTLIL DRGKELTKKG DVKSGISFVK RYSSQFPSVK EEYEVWIDSI 
FGHKIERTSE GRRDVLRLQV QMNLDIALDP VYATMRSECH MVKHIFDTLV YVNEESNYIE 
PRLAFQWEYN DAEKIWTFYL RKGVHFHNRK QLTAHDVIHS WNRFMKAENN PHAWMLQHIE 
SFRAVDEYVI EIQLRTENRM FLHMISAEQC SIVKEDEARN LIGTGPFKLS EKNAHLFVLE 
AHDLYYRERS FLDRIELLNV EQSVNTYDIL VKAQYKDKEK HNKELSRLES NVTYITCNLA 
KEGSMQDYMF RKALYKIIHG QAIVQELGGE RGEVAKEILL ASDSIVEIEE DIESLIKESM 
YQNEVLQLYT FTGQDHVEDA QWIQKECAKY GIRVENNFLE IEELLEINTI QKADMMHDSA 
TISERIEDSL LYMFLTKNSF IHGQSSMDFH ATLSPYFKLE QVENRVTLLR DIEDTLLRQI 
HVIPLYRNKQ QVTSHEKVQN IMINSQGWID FYKIWFKP