Gene BAS3194 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS3194
Symbol
ID	2851828
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	-
Start bp	3171994
End bp	3173241
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	37%
IMG OID	637506438
Product	major facilitator family transporter
Protein accession	YP_029451
Protein GI	49186199
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATAGGAA TTATAGGGAA GAGGGGAAAT CAATTGAATT CATATACAGC ATCGTCTTCA 
GAAGTTCAGA CGAATCGAAG AAGTATATTT GCGTTATTAG CGCTAGCAAT TAGTGCGTTC 
GGGATTGGGA CAACTGAATT TGTTAGTGTC GGTTTATTAC CATCTATTTC GAAAGATTTA 
CATGTGTCGG TGACAACAGC TGGTTTAACA GTTTCTTTAT ATGCGTTAGG AGTAGCATTT 
GGTGCTCCAG TATTAACGTC GTTAACAGCT AATATGTCAC GAAAAACGTT ATTAATGTGG 
ATTATGATTA TTTTCATTAT TGGTAACGGA ATTGCGGCTG TCGCAACAAG CTTCACTGTA 
TTACTTATTG CGCGAATTGT GTCTGCACTT TCGCATGGTG TGTTTATGTC AATTGGTTCA 
ACGATTGCTG CGGCACTCGT ACCAGAAAAT AAACGTGCTA GCGCGATTGC GATTATGTTT 
ACTGGCGTAA CAGTCGCAAC TATTACAGGT GCACCAATTG GAACATTTAT CGGTCAACAA 
TTTGGCTGGA GAACATCATT TTTAGCAATT GTAGTCATTG GAATTATTGC TTTAATCGCA 
AATAGTATTC TCATTCCATC TAATATGAAA AAAGGTACGT CTGTATCATT CCGCGATCAA 
TTTAAACTGG TTACGAACGG AAGACTGTTA CTTGTTTTCA TTATTACTGC ACTTGGATAC 
GGCGGTACAT TCGTAACATT TACGTATTTA TCTCCGTTAT TACAAGAAGT AACAGGATTT 
AAAGCTAATA CGGTTACGAT CATTTTATTA GTATATGGAA TCGCTATTGC AATAGGGAAT 
GTGATTGGCG GGAAATTATC GAATCATAAT CCAATTCGAG CGCTATTTTA CATGTTCTTT 
ATTCAAGCGA TTATATTATT TGTTTTAACA TTTACAGCGC CATTTAAAGT AGCTGGGTTA 
ATTACAATTA TTTTCATGGG ACTATTCGCA TTTATGAATG TTCCAGGGTT ACAAGTATAT 
GTCGTAATGT TAGCTGAACG ATTTGTACCG AGTGCTGTCG ATGTTGCATC GGCAATTAAT 
ATTGCGGCTT TTAATGCTGG GATTGCTCTT GGTGCTTATT TAGGTGGTAT TGTAACGAAT 
TCGTTAGGGT TAATTCATAC GGCTTGGGTA GGCGGCATTA TGGTAGTAGG TGCTGTTATT 
TTAACAGCAT GGAGTATGTC ATTAGAAAAA CGAGATCAAG TAAAATAA

Protein sequence

MIGIIGKRGN QLNSYTASSS EVQTNRRSIF ALLALAISAF GIGTTEFVSV GLLPSISKDL 
HVSVTTAGLT VSLYALGVAF GAPVLTSLTA NMSRKTLLMW IMIIFIIGNG IAAVATSFTV 
LLIARIVSAL SHGVFMSIGS TIAAALVPEN KRASAIAIMF TGVTVATITG APIGTFIGQQ 
FGWRTSFLAI VVIGIIALIA NSILIPSNMK KGTSVSFRDQ FKLVTNGRLL LVFIITALGY 
GGTFVTFTYL SPLLQEVTGF KANTVTIILL VYGIAIAIGN VIGGKLSNHN PIRALFYMFF 
IQAIILFVLT FTAPFKVAGL ITIIFMGLFA FMNVPGLQVY VVMLAERFVP SAVDVASAIN 
IAAFNAGIAL GAYLGGIVTN SLGLIHTAWV GGIMVVGAVI LTAWSMSLEK RDQVK