Gene BAS3062 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS3062
Symbol
ID	2848293
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	-
Start bp	3040292
End bp	3041461
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	38%
IMG OID	637506306
Product	transporter
Protein accession	YP_029319
Protein GI	49186067
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0534836
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTAATT TTAAAAATAA AGTAATTGAT AAGGATATTT CATCAGGTTT AATCATTCTT 
TTAGCAACTG CATGTGGTAT TATTGTGGCT AATCTTTATT ATGCACAGCC TTTAATTGGG 
GTAATTAGTA ATGAAATTGG GCTTTCTAAT AGTAGCGCTG GATTAATTGT AACGCTAACT 
CAAATTGGAT ATGTTGTTGG CTTACTATTT CTTGTGCCTT TGGGGGATAT TGTTGAGAAT 
AAAAAATTGA TACTTATATT GTTATTTTTA AGTGCATTTG CACTCATTTC CATGGTTTTT 
GTAAAAAGCG CAACTTTGTT GTTAATTGCT TCATTCTTTA TCGGACTGGG TTCGGTCGCA 
GCGCAAGTAC TCGTACCTCT TGTATCATAT CTTTCATCTG AGAATGCACG CGGTCGCGTA 
GTTGGCAATG TCATGAGTGG TCTGTTATTA GGTATTATGC TTGCGCGACC GATATCTAGT 
CTAGTAGCCG ATATGTGGGG ATGGAATGCA ATATTTGCTT TATCTGCTAC TGTAATTATT 
GTCTTAGCGT TTGTATTATC GAAAGTACTC CCTACTAGGA AACCACAGGT AAAAACAAAT 
TATATAGCCT TACTTAATTC AATGTGGCAA CTGCTACGAA CTACTCCAAT TTTACGCCGT 
CGCGCCATTT ATCATGCTTG TGTATTTGGG GCTTTCAGCT TATTCTGGAC CACTGTTCCA 
TTATTATTAT CTAGTCCTGC TTTTCATTTT TCTCAGACTG CCATAGCATT ATATGCACTT 
GTCGGAATTA CAGGTGCAAT AGCCGCTCCA ATAGGTGGTC GTCTAGCTGA TCTTGGCTGG 
ACACGATCCG CCACTGGGAT AGCTCTCACT GTTGTTATTA TTTCTTTATT ACTACCACTT 
ATTATTCAAA GTAGTTCGCC CATCGGAATA GCTGTTTTAG TAATTGCTGC AATTCTGTTA 
GACATGGGAG TATCTGCAAA CCTTGTGCTT AGCCAACGTT TAATTTTCTC GTTAAGTCCA 
GAAATTCGTA GTCGATTAAA CGGACTATTT ATGGCTATTT TCTTTTTAGG AGGTGCTGTT 
GGATCCTTTA TTGGAGGATG GAATCTAACA TTATGGATAG GAATCGCTTT TCCGACCATA 
GCCTTGCTTT ATTTTGCTAG AGAAAAATAG

Protein sequence

MSNFKNKVID KDISSGLIIL LATACGIIVA NLYYAQPLIG VISNEIGLSN SSAGLIVTLT 
QIGYVVGLLF LVPLGDIVEN KKLILILLFL SAFALISMVF VKSATLLLIA SFFIGLGSVA 
AQVLVPLVSY LSSENARGRV VGNVMSGLLL GIMLARPISS LVADMWGWNA IFALSATVII 
VLAFVLSKVL PTRKPQVKTN YIALLNSMWQ LLRTTPILRR RAIYHACVFG AFSLFWTTVP 
LLLSSPAFHF SQTAIALYAL VGITGAIAAP IGGRLADLGW TRSATGIALT VVIISLLLPL 
IIQSSSPIGI AVLVIAAILL DMGVSANLVL SQRLIFSLSP EIRSRLNGLF MAIFFLGGAV 
GSFIGGWNLT LWIGIAFPTI ALLYFAREK