Gene BAS4380 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS4380
Symbol
ID	2851697
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	-
Start bp	4292464
End bp	4293789
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	34%
IMG OID	637507617
Product	major facilitator family transporter
Protein accession	YP_030627
Protein GI	49187375
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.000000603608
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGGAAAG ATATAAGTAA CCATTCAAAA TGGTTTGTTT TCACATTATG TTTTATCGTT 
TTATTAGGAC CGGTGAATGC GGTTTTATTT AATGTTGCGT TAGAGGATAT GGCTCATGAT 
TTATCCATTA GTCAATCGAA AGTAAGTTGG GTTGTAGTAG GTTACTCCTT AGTTGTCGGT 
ATTGGTTCGA TGATATATGG GAAACTGGCT GATCGTTATA GTGTGAAAAA ACTATTAATT 
ATTTCAATCA TCATATTTGT AGCGGGTTCT ATTATTGGAT TTGTAAATCA ATCATATGCG 
ATTGTCATTT TTGCAAGATT AGTGCAGGCG AGTGGGGGCG CGGCGTTTAT TGCGCTTAGT 
ATGATTGCGG TAGCAAAATT AGTTGCTCCT GCTAAGAAGC CTGGTGCTTT AGCGATGATT 
AGTTCTTCTA TTGCGTTAGC GGTTGGTATT GGTCCTTTAG TTGGTGGGGC TATTACAAAT 
ACACTAGGGT GGCCATATTT ATTTTTATTT ATGATTATCT CAGTATTGGG GATTTTCTTG 
CTTATAAAAT TTATGCCAGG AGAAGCGCAT CATACGGATG AAGTGTTTTA TTTTGATTAC 
ATTGGAGCGG CGTTACTATT TGTATTTATT ACGACTGTTT TGGTAGGTGT TAATATGAAT 
AGTTGGCTAT TTGTGTTATC GATAATTTCC TTATTTTTAT TCACGGTTCG TATGAAGAAA 
GCGGAGCACC CATTTATCGA TATTGAGTTA TTTTCGAACA AAGCATTTCT TCGTTTAATA 
ACAGTCGGAT TTATAATTAA TGTGGCGTTA TGTGCTAATT TATTATTATT GCCATTACTG 
TTAGGAAGAG TACACGGATT GTCGCCGTTT ATTATCGGAA TTGTATTATT TGTTGCATCA 
CTTTTCGGTA TTGTGTCTAG TTTTATTACT GGAAAGATTA TCCCTTCGTT TGGAAATGTG 
AATATGATTT ATGTAGCGTC TGTCATTATG ATTGTTGGCT TTTTAATTTT GGGGTTTATT 
CCGAATGGAA GTATAGTCGT TATTGTATTG GCGATTATTT TAACGTTTAT GAGTTATTCT 
GCCATTCAAG TATCATTGAA CACATTTATA CCGAAAACAT TACATGTAGC TAAAGTTGGA 
GTCGGTCTTG GTTTATATAA TTTAATTAAC TTTTTCGGTA TGGCATTTGG ACCAGCTGTA 
GCAAGCCGAA TTATGGAATC TACAAATAGT TATCGTTTTA ATTTTATTTT AATCGTCATG 
TTAATTTCTG CTCATTTCTT CTTATTAATA GGAATGTCTT CTTTCCGAAA AAAGATGGAG 
CATTAA

Protein sequence

MGKDISNHSK WFVFTLCFIV LLGPVNAVLF NVALEDMAHD LSISQSKVSW VVVGYSLVVG 
IGSMIYGKLA DRYSVKKLLI ISIIIFVAGS IIGFVNQSYA IVIFARLVQA SGGAAFIALS 
MIAVAKLVAP AKKPGALAMI SSSIALAVGI GPLVGGAITN TLGWPYLFLF MIISVLGIFL 
LIKFMPGEAH HTDEVFYFDY IGAALLFVFI TTVLVGVNMN SWLFVLSIIS LFLFTVRMKK 
AEHPFIDIEL FSNKAFLRLI TVGFIINVAL CANLLLLPLL LGRVHGLSPF IIGIVLFVAS 
LFGIVSSFIT GKIIPSFGNV NMIYVASVIM IVGFLILGFI PNGSIVVIVL AIILTFMSYS 
AIQVSLNTFI PKTLHVAKVG VGLGLYNLIN FFGMAFGPAV ASRIMESTNS YRFNFILIVM 
LISAHFFLLI GMSSFRKKME H