Gene ECH74115_3308 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_3308
Symbol	setB
ID	6968389
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	3040154
End bp	3041335
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	53%
IMG OID	643387119
Product	sugar efflux transporter B
Protein accession	YP_002271583
Protein GI	209398972
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00899] sugar efflux transporter

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.0000181486
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	0.0175789
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATAACT CCCCCGCAGT CTCCAGCGCG AAATCGTTTG ACCTGACCTC GACGGCGTTT 
TTAATCGTTG CCTTTCTCAC CGGTATTGCG GGCGCTCTGC AAACCCCGAC ACTCAGTATT 
TTTCTTACCG ATGAAGTACA TGCCCGTCCG GCGATGGTGG GATTCTTCTT TACCGGCAGC 
GCTGTCATTG GGGTTCTGGT GAGTCAGTTT CTCGCCGGGC GCTCTGATAA GCGCGGCGAT 
CGCAAATCGC TGATTGTCTT TTGCTGCCTG TTAGGCGTGC TGGCCTGCAC CCTTTTTGCC 
TGGAATCGCA ACTACTTTGT TTTGCTATTC GTTGGCGTCT TTCTTAGCAG CTTTGGCTCG 
ACCGCTAACC CGCAAATGTT TGCCCTTGCC CGTGAACATG CCGACAAAAC CGGACGTGAG 
GCGGTGATGT TCAGCTCTTT TTTACGCGCT CAGGTTTCAC TGGCATGGGT CATTGGCCCA 
CCGCTGGCTT ATGCCTTAGC GATGGGTTTC AGCTTTACGG TAATGTATCT GAGCGCAGCG 
GTAGCATTTA TTGTTTGCGG CGTGATGGTG TGGCTGTTTT TACCGTCGAT GCAAAAAGAG 
CTTCCGCTGG CGACCGGCAC GGTTGAAGCG CCGCGCCGTA ACCGTCGCGA TACGCTGCTG 
CTGTTTGTCA TTTGTACATT GATGTGGGGC TCGAACAGCC TGTACATCAT CAACATGCCG 
CTATTTATTA TCAACGAACT CCATCTTCCC GAGAAACTGG CCGGTGTGAT GATGGGGACC 
GCCGCCGGGC TGGAAATCCC GACCATGTTG ATTGCCGGAT ATTTCGCCAA ACGTCTGGGT 
AAGCGTTTCT TAATGCGCGT TGCTGCCGTG GGTGGCGTCT GTTTTTACGC AGGAATGCTG 
ATGGCGCATT CTCCTGTCAT TCTGTTGGGC TTGCAGCTGC TAAATGCTAT TTTTATTGGC 
ATTCTGGGCG GTATCGGGAT GCTCTATTTT CAGGATCTGA TGCCCGGTCA GGCAGGTTCA 
GCCACCACGC TCTATACCAA CACGTCGCGC GTGGGCTGGA TCATCGCGGG ATCAGTGGCG 
GGCATCGTCG CCGAGATCTG GAATTATCAC GCTGTGTTCT GGTTTGCGAT GGTGATGATT 
ATCGCCACTC TGTTTTGCTT ACTGCGGATT AAAGATGTTT AA

Protein sequence

MHNSPAVSSA KSFDLTSTAF LIVAFLTGIA GALQTPTLSI FLTDEVHARP AMVGFFFTGS 
AVIGVLVSQF LAGRSDKRGD RKSLIVFCCL LGVLACTLFA WNRNYFVLLF VGVFLSSFGS 
TANPQMFALA REHADKTGRE AVMFSSFLRA QVSLAWVIGP PLAYALAMGF SFTVMYLSAA 
VAFIVCGVMV WLFLPSMQKE LPLATGTVEA PRRNRRDTLL LFVICTLMWG SNSLYIINMP 
LFIINELHLP EKLAGVMMGT AAGLEIPTML IAGYFAKRLG KRFLMRVAAV GGVCFYAGML 
MAHSPVILLG LQLLNAIFIG ILGGIGMLYF QDLMPGQAGS ATTLYTNTSR VGWIIAGSVA 
GIVAEIWNYH AVFWFAMVMI IATLFCLLRI KDV