Gene BAS2698 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS2698
Symbol
ID	2848734
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	+
Start bp	2678385
End bp	2679587
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	34%
IMG OID	637505943
Product	transporter
Protein accession	YP_028956
Protein GI	49185704
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0119917
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTGGCGTA ATAAAAATGT TTGGATTGTT TTAATTGGGG AGTTTATTGC TGGTTTAGGG 
TTATGGCTTG GAATTCTTGG CAACCTGGAA TTTATGCAAA AATATGTCCC TTCTGATTTC 
ATGAAATCAG TTATATTGTT TATCGGACTA TTAGCAGGTG TTCTAGTGGG ACCTATGGCT 
GGTCGTATCA TCGATCAATA TGAAAAGAAA AAAGTCCATC TTTATGCTGG TTTTGGTCGT 
GTTATTAGTG TTATTTTTAT GTTTTTCGCT ATCCAATTTG AAAGTATCGC CTTTATGATT 
GCATTTATGG TTGCACTTCA AATTTCAGCA GCATTTTATT TCCCTGCATT ACAATCTGTA 
ATTCCACTCA TCGTACGTGA GCATGAGTTA TTACAAATGA ACGGTGTACA TATGAATGTA 
GGTACAATCG CTCGTATTGC AGGTACTTCA CTAGGTGGAA TTCTTTTAGT TGTAATGAGT 
TTACAATATA TGTACGCCTT CTCAATGGCA GCATATGCTT TATTATTCCT CTCAACTTTC 
TTCCTACAAT TCGAAGATAA GAAATCAACA ACACCAAGTA AACAAGCTGC AAAAGATAAT 
AGCTTTATGG AAGTATTTCG TATTTTAAGA GGAATTCCGA TTGCTTTCAC AGCACTTATA 
TTAAGTATTA TCCCTCTATT ATTTATAGCT GGATTTAATT TAATGGTAAT TAATATTAGC 
GAAATGCAAC ATGATCCAAC GATTAAAGGC TTTATATATA CGATTGAAGG TATCGCATTT 
ATGTTAGGCG CCTTCGTTAT TAAACGTTTA TCTGATCATT TCAAACCTGA AAAGTTACTA 
TATTTCTTCG CTGTTTGTAC CGCTTTTGCA CATCTATCAT TGTTCTTTAG CGATATAAAA 
TGGATGTCTC TTACATCATT TGGATTGTTT GGTTTTAGTG TTGGTTGTTT CTTCCCTATT 
ATGTCGACAA TTTTCCAAAC GAAAGTGGAA AAGAGCTATC ACGGCCGACT CTTCTCATTC 
CGTAATATGT TTGAAAGAGT GATGTTCCAA ATTGTCTTAC TTGGCACAGG CTTCTTCTTA 
GATACGATTG GATTGCAATA TATGGTTCTT ATTTTCGGTG TTATTTCATT ATTCATTATT 
TTCATATCGC TTTCTAAACA GAAACAGTAC GAAAAACAAC CATCGCAATC TGCGAATTTA 
TAA

Protein sequence

MWRNKNVWIV LIGEFIAGLG LWLGILGNLE FMQKYVPSDF MKSVILFIGL LAGVLVGPMA 
GRIIDQYEKK KVHLYAGFGR VISVIFMFFA IQFESIAFMI AFMVALQISA AFYFPALQSV 
IPLIVREHEL LQMNGVHMNV GTIARIAGTS LGGILLVVMS LQYMYAFSMA AYALLFLSTF 
FLQFEDKKST TPSKQAAKDN SFMEVFRILR GIPIAFTALI LSIIPLLFIA GFNLMVINIS 
EMQHDPTIKG FIYTIEGIAF MLGAFVIKRL SDHFKPEKLL YFFAVCTAFA HLSLFFSDIK 
WMSLTSFGLF GFSVGCFFPI MSTIFQTKVE KSYHGRLFSF RNMFERVMFQ IVLLGTGFFL 
DTIGLQYMVL IFGVISLFII FISLSKQKQY EKQPSQSANL