Gene BAS5271 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS5271
Symbol
ID	2852414
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	-
Start bp	5153438
End bp	5154637
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	38%
IMG OID	637508525
Product	major facilitator family transporter
Protein accession	YP_031509
Protein GI	49188256
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000000222558
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGGCAAGG TGAAAGAAAT TTCGAAGCGA AAGCTACTTG GTATAGCGGG GCTTGGATGG 
TTATTTGATG CAATGGATGT TGGAATGCTT TCATTTGTAA TGGTGGCATT GCAAAAAGAT 
TGGGGATTAA GTACGCAAGA AATGGGCTGG ATAGGCAGCA TTAATTCAAT TGGTATGGCA 
GTTGGAGCGC TCGTTTTTGG AATACTATCA GATAAAATAG GGCGGAAATC AGTCTTTATT 
ATTACATTAT TATTATTTTC TATCGGTAGT GGTTTAACGG CTTTAACGAC AACACTTGCT 
ATGTTCCTTG TTTTAAGATT TTTAATCGGT ATGGGGCTAG GGGGAGAGCT TCCAGTTGCC 
TCTACATTAG TATCAGAGAG TGTTGAAGCA CATGAACGCG GCAAAATAGT TGTGTTATTA 
GAAAGTTTTT GGGCAGGTGG ATGGTTAATT GCGGCTCTTA TCTCGTATTT TGTTATACCG 
AAATATGGTT GGGAAGTTGC GATGATATTA AGTGCGATTC CGGCGCTATA TGCTTTATAT 
TTAAGATGGA ATTTACCGGA TTCTCCGAGA TTCCAAAAGG TTGAAAAAAG GCCATCTGTT 
ATCGAAAATA TAAAGTCAGT TTGGTCTGGA GAATACCGTA AGGCAACAAT TATGTTATGG 
ATTTTATGGT TTTCTGTTGT CTTTTCCTAT TATGGAATGT TCCTTTGGTT ACCTAGTGTA 
ATGGTATTAA AAGGATTTAG TTTAATAAAA AGTTTCCAAT ACGTACTTAT TATGACGTTA 
GCTCAATTGC CGGGTTATTT CACAGCTGCT TGGTTTATTG AACGTCTTGG TCGTAAGTTT 
GTTTTAGTTA CGTATTTAAT TGGTACAGCA TGCAGTGCTT ACTTATTTGG AGTAGCAGAG 
TCATTAACAG TATTAATCGT AGCAGGCATG TTACTATCCT TCTTTAATTT AGGTGCTTGG 
GGTGCATTAT ATGCCTACAC ACCTGAACAA TATCCAACAG TTATTCGTGG TACAGGTGCA 
GGGATGGCAG CAGCATTTGG TCGTATTGGT GGTATTCTTG GACCGCTATT AGTAGGATAT 
TTAGTTGCTT CACAGGCTTC ACTATCACTA ATATTTACGA TTTTCTGTGG ATCCATTTTA 
ATAGGCGTAT TTGCTGTAAT TATACTTGGG CAAGAAACGA AACAACGAGA ATTAGTATAA

Protein sequence

MGKVKEISKR KLLGIAGLGW LFDAMDVGML SFVMVALQKD WGLSTQEMGW IGSINSIGMA 
VGALVFGILS DKIGRKSVFI ITLLLFSIGS GLTALTTTLA MFLVLRFLIG MGLGGELPVA 
STLVSESVEA HERGKIVVLL ESFWAGGWLI AALISYFVIP KYGWEVAMIL SAIPALYALY 
LRWNLPDSPR FQKVEKRPSV IENIKSVWSG EYRKATIMLW ILWFSVVFSY YGMFLWLPSV 
MVLKGFSLIK SFQYVLIMTL AQLPGYFTAA WFIERLGRKF VLVTYLIGTA CSAYLFGVAE 
SLTVLIVAGM LLSFFNLGAW GALYAYTPEQ YPTVIRGTGA GMAAAFGRIG GILGPLLVGY 
LVASQASLSL IFTIFCGSIL IGVFAVIILG QETKQRELV