Gene BAS0949 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS0949
Symbol
ID	2849486
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	+
Start bp	1005397
End bp	1006617
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	31%
IMG OID	637504209
Product	transporter
Protein accession	YP_027223
Protein GI	49183971
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.800881
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATAAATT TGACTAAAAA GACAAATTTT CTAATATTCA TTTTAGCAAT TAGTTGTGGC 
TCACTTGTTG CGAATATTTA TTATGCACAG CCAATTGTAC AATTCATTGC AAAAGACTTG 
AATATCGCTT CGGATTTATC TGGATTGCTC ACTACTTTGA CGCAAATTGG ATATGGATTG 
GGCTTGTTTT TTATCGTACC AATGGCAGAT TTATTCAAAA GTAAGAAAAT AATAGGTATT 
CTTATCGGAC TCACTATTAT TTCATTGATT GGTACGCTAA TTTCGACAAA TGGAATTGTT 
TTTTTAATAC TAACAACTGT AATTGGTATT GGAGCCTGTG CAGCTCAAAT GTTAGTTCCG 
CTAACAATGA GGATTGTACC TATTGAAGAG ATGGGTAAAT ATGTGGGTAA AGTAATGAGT 
GGTTTATTAA TTGGGATTAT GATTGCTCGC CCATTATCTA TCGGAATAAC TGAATGGTTC 
GGCTGGAGAA TGGTATTTCT TTTTTCACTA ATCATTCTAG TTGCTGTATT ACTTTTACTT 
ATAAAATTTT TGCCCAACTA TGAAGTAGTA TCAAATAGTA ACATGTCATA TTCAAATTTA 
ATAGCTTCTA TGGTAAAACT GCTACTACAT ACTTCTCCGT TACAACAAAG AGCTTTTTAT 
CACGCATGTT TATTTGCAAC ATTTAGTCTT TATTGGACAG TTATTCCAAT CTTATTACGG 
TCAGAACCAT TACATTTCTC AAATAATGAA ATTGCATTGT TTGGATTTGC TGCAATAGCT 
GGAGCTTTAT TAACTCCTAC TATTGGTAAA ATCGCAGATA AAGGCTATAT TTTTACAATG 
ACTAATGTAT CAATGGCGCT CGTACTATTA TCTATCGTAC TATTATTTTT TGTTCAAGAT 
CATTCACTTT TTAGTGTGAT TGTAATACTT ATTTCAGGTA TTAGCATCGA TATTGGTGTA 
GCAGGAAATT TATTATTAGG TCAAAAAGTT ATCTTTAGTT TGAATCCTGA GATAAGAAAC 
AGACTGAATG GATTATATAT GACCATTTTC TTTTTGGGAG GAGCCTTTGG TTCATGTATT 
GGAAGTTATA CGTACTATAA ATTTAATAGC GAAGTACCGT TACTCATTGG AGCGGCTTTA 
CCTTTAATCG CCTTATTTGT GCATTTAATA AAAAATAATG CGATACATTT ATCAAAAACG 
AAAAATAAAT ATATGTCTTA A

Protein sequence

MINLTKKTNF LIFILAISCG SLVANIYYAQ PIVQFIAKDL NIASDLSGLL TTLTQIGYGL 
GLFFIVPMAD LFKSKKIIGI LIGLTIISLI GTLISTNGIV FLILTTVIGI GACAAQMLVP 
LTMRIVPIEE MGKYVGKVMS GLLIGIMIAR PLSIGITEWF GWRMVFLFSL IILVAVLLLL 
IKFLPNYEVV SNSNMSYSNL IASMVKLLLH TSPLQQRAFY HACLFATFSL YWTVIPILLR 
SEPLHFSNNE IALFGFAAIA GALLTPTIGK IADKGYIFTM TNVSMALVLL SIVLLFFVQD 
HSLFSVIVIL ISGISIDIGV AGNLLLGQKV IFSLNPEIRN RLNGLYMTIF FLGGAFGSCI 
GSYTYYKFNS EVPLLIGAAL PLIALFVHLI KNNAIHLSKT KNKYMS