Gene EcHS_A2308 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A2308
Symbol	setB
ID	5594337
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	2306041
End bp	2307222
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	53%
IMG OID	640921434
Product	sugar efflux transporter B
Protein accession	YP_001458970
Protein GI	157161652
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00899] sugar efflux transporter

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.000000000000102092
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCATAACT CCCCCGCAGT CTCCAGCGCG AAATCGTTTG ACCTGACCTC GACGGCGTTT 
TTAATCGTTG CCTTTCTCAC CGGTATTGCG GGCGCTCTGC AAACCCCGAC ACTCAGTATT 
TTTCTTACCG ATGAAGTACA TGCCCGTCCG GCGATGGTGG GATTCTTCTT TACCGGCAGC 
GCTGTCATTG GGATTCTGGT AAGTCAGTTT CTCGCCGGGC GCTCTGATAA GCGCGGCGAT 
CGCAAATCGC TGATTGTCTT TTGCTGCCTG TTAGGCGTGC TGGCCTGCAC CCTTTTTGCC 
TGGAATCGCA ACTACTTTGT TTTGCTATTC GTTGGCGTCT TTCTTAGCAG CTTTGGCTCG 
ACCGCTAACC CGCAAATGTT TGCCCTTGCC CGTGAACATG CCGACAAAAC CGGACGTGAG 
GCGGTGATGT TCAGTTCTTT TTTACGCGCT CAGGTTTCAC TGGCATGGGT CATTGGCCCA 
CCGCTGGCTT ATGCCTTAGC GATGGGTTTC AGCTTTACGG TAATGTATCT GAGCGCAGCG 
GTAGCGTTTA TTGTTTGCGG CGTGATGGTG TGGCTGTTTT TACCGTCGAT GCAAAAAGAG 
CTTCCGCTGG CGACCGGCAC GATTGAAGCG CCGCGCCGTA ACCGTCGCGA TACGCTGCTG 
CTGTTTGTCA TTTGTACATT GATGTGGGGC TCGAACAGCC TGTACATCAT CAACATGCCG 
CTATTTATTA TCAACGAACT GCATCTTCCC GAGAAACTGG CCGGTGTGAT GATGGGGACC 
GCCGCCGGGC TGGAAATCCC GACCATGTTG ATTGCCGGAT ATTTCGCCAA ACGTCTGGGT 
AAGCGTTTCT TAATGCGCGT TGCTGCCGTG GGTGGCGTCT GTTTTTACGC AGGAATGCTG 
ATGGCGCATT CACCTGTCAT TCTGTTGGGC TTGCAGCTGC TAAATGCTAT TTTTATTGGC 
ATTCTGGGTG GCATCGGGAT GCTCTATTTT CAGGATTTGA TGCCCGGTCA GGCAGGTTCA 
GCCACCACGC TCTATACCAA CACGTCGCGC GTGGGCTGGA TCATCGCAGG ATCAGTGGCG 
GGCATCGTCG CCGAGATCTG GAATTATCAC GCTGTGTTCT GGTTTGCGAT GGTGATGATT 
ATCGCCACTC TGTTTTGCTT ACTGCGGATT AAAGATGTTT AA

Protein sequence

MHNSPAVSSA KSFDLTSTAF LIVAFLTGIA GALQTPTLSI FLTDEVHARP AMVGFFFTGS 
AVIGILVSQF LAGRSDKRGD RKSLIVFCCL LGVLACTLFA WNRNYFVLLF VGVFLSSFGS 
TANPQMFALA REHADKTGRE AVMFSSFLRA QVSLAWVIGP PLAYALAMGF SFTVMYLSAA 
VAFIVCGVMV WLFLPSMQKE LPLATGTIEA PRRNRRDTLL LFVICTLMWG SNSLYIINMP 
LFIINELHLP EKLAGVMMGT AAGLEIPTML IAGYFAKRLG KRFLMRVAAV GGVCFYAGML 
MAHSPVILLG LQLLNAIFIG ILGGIGMLYF QDLMPGQAGS ATTLYTNTSR VGWIIAGSVA 
GIVAEIWNYH AVFWFAMVMI IATLFCLLRI KDV