Gene BAS3100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS3100
Symbol
ID	2851204
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	+
Start bp	3079565
End bp	3080764
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	36%
IMG OID	637506344
Product	major facilitator family transporter
Protein accession	YP_029357
Protein GI	49186105
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.085117
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAAGTG AAAAACTTTG GACGAAGGAT TTCCTCGGAA CTTGTTTTAG TAGTCTCTTT 
CTCTTTTTAA CATTTTACAT GCTAATGACT ACTCTGCCTG TCTATGTAAT AGACGGGCTA 
AAAGGAAAAC CAGAGGAAAT TGGTTTAGTT GCAACTGTTT TTCTTATTTC ATCTGTTTTA 
TGTAGACCAT TCACAGGAAA ATGGCTAGAT GATTTAGGAA GAAAGAAAAT ATTATTTATT 
TCACTTTCAT TATTTTTAGC CGCTACTGTT ATGTATTTCG GTGCGCAAAG TTTATTTTTA 
TTACTTGCTC TTCGCTTCTT ACATGGTATT GGGTTTGGGA TGGCAACTAC TGCAACTGGT 
ACGATTGTAA CTGATGTTGC ACCAGCTCAT AGACGAGGCG AAGCACTTGC CTATTTCGGC 
GTATTTATGA GTCTGCCGAT GGTAATTGGT CCTTTTTTAG GTTTAACAAT TATTTCTCAT 
TTTTCGTTTA CTGTATTATT TATCGTTTGT TCCGTATTTT CATTACTGGC ATTTTTATTA 
GGACTACTTG TAAATATTCC ACATGAAGCA CCTGTAAGCA AACAAAAACA AGAAAAAATG 
AAATGGAAAG ACTTACTTGA ACCATCTTCT ATTCCAATCG CTCTTACAGG ATTTGTTTTA 
GCCTTTTCTT ATAGTGGTAT TTTATCCTTT ATTCCTATTT ATGCAAAAGA GCTCGGTTTA 
GCTGATATTG CAAGTTACTT CTTTATTTTA TATGCACTTG TTGTTGTCAT TTCTCGTCCA 
TTTACAGGTA AAATTTTCGA TCGCTTCGGT GAAAACGTAC TTGTTTATCC TGCTATTATT 
ATTTTCACAA TTGGGATGTT TATTTTAAGT CAGGCGCAAA CGCCATTTTG GTTCCTTGGC 
GCAGGTATGC TAATTGGTTT AGGTTATGGA ACATTAATTC CTAGCTTCCA AACGATTGCG 
ATTTCTGCCG CTCCAAACCA TAGACGTGGT TCTGCGACAG CTACGTACTT CTCATTCTTT 
GATAGTGGTA TTGGATTTGG TTCTTTCATT TTAGGTATAG TCGCAGCGAA ATCAAGTTAC 
CATAATATGT ATTTTATCGC GGCTATTATC GTTGCTTTCA CTTTACTTCT ATATTATGGA 
TTACACGGCC GCAAACAAAA ATTCAAGAAA CAACGTACAG ATGGACAAAT ATCCGCTTAG

Protein sequence

MQSEKLWTKD FLGTCFSSLF LFLTFYMLMT TLPVYVIDGL KGKPEEIGLV ATVFLISSVL 
CRPFTGKWLD DLGRKKILFI SLSLFLAATV MYFGAQSLFL LLALRFLHGI GFGMATTATG 
TIVTDVAPAH RRGEALAYFG VFMSLPMVIG PFLGLTIISH FSFTVLFIVC SVFSLLAFLL 
GLLVNIPHEA PVSKQKQEKM KWKDLLEPSS IPIALTGFVL AFSYSGILSF IPIYAKELGL 
ADIASYFFIL YALVVVISRP FTGKIFDRFG ENVLVYPAII IFTIGMFILS QAQTPFWFLG 
AGMLIGLGYG TLIPSFQTIA ISAAPNHRRG SATATYFSFF DSGIGFGSFI LGIVAAKSSY 
HNMYFIAAII VAFTLLLYYG LHGRKQKFKK QRTDGQISA