Gene EcSMS35_4152 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4152
Symbol	rfbB2
ID	6143553
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	4252169
End bp	4253236
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	54%
IMG OID	641618975
Product	dTDP-glucose 4,6-dehydratase
Protein accession	YP_001746107
Protein GI	170683610
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1088] dTDP-D-glucose 4,6-dehydratase
TIGRFAM ID	[TIGR01181] dTDP-glucose 4,6-dehydratase

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	59
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAAAGA TTCTGATAAC AGGTGGTGCC GGGTTTATTG GCTCGGCGCT GGTGCGTTAT 
ATCATCAACG AAACGAGCGA CGCGGTGGTA GTGGTCGATA AGCTGACCTA CGCCGGAAAT 
CTGATGTCGC TGGCACCGGT CGCGCAAAGC GAGCGCTTTG CCTTTGAGAA AGTTGATATC 
TGCGATCGGG CAGAACTGGC GCGCGTATTC ACTGAGCATC AGCCAGACTG TGTCATGCAT 
CTGGCAGCCG AAAGCCATGT TGACCGTTCT ATTGACGGCC CGGCAGCGTT TATTGAAACC 
AACATTGTCG GGACTTATAC ATTGCTTGAA GCGGCGCGGA CTTACTGGAA TGCGCTGACG 
GAAGATAAAA AATCAGCGTT CCGTTTTCAT CATATCTCCA CCGACGAAGT ATATGGTGAC 
CTGCACTCGA CGGATGATTT CTTCACCGAA ACCACGCCGT ATGCGCCGAG CAGCCCTTAT 
TCCGCTTCAA AAGCCAGCAG TGACCATCTG GTACGCGCCT GGCTGCGGAC CTATGGTCTG 
CCGACGCTTA TCACCAACTG CTCGAATAAC TACGGCCCTT ACCACTTTCC GGAAAAACTG 
ATCCCGCTGA TGATCCTCAA CGCGCTGGCG GGTAAACCGC TGCCGGTATA TGGCAACGGG 
CAGCAAATCC GTGACTGGCT GTATGTTGAA GATCACGCCC GCGCGCTGTA TTGCGTGGCG 
ACCACCGGGA AAGTCGGTGA AACCTATAAT ATTGGTGGTC ACAACGAGCG TAAGAATCTC 
GATGTTGTGG AAACCATTTG CGAGCTGCTG GAAGAACTGG CTCCGAACAA GCCGCACGGC 
GTGGCGCACT ATCGTGACCT GATCACCTTT GTCGCTGACC GTCCGGGGCA TGATCTGCGT 
TATGCCATTG ATGCTTCGAA AATTGCCCGT GAACTTGGCT GGCTGCCGCA GGAAACCTTT 
GAAAGTGGAA TGCGTAAAAC GGTGCAGTGG TATCTGGCTA ATGAAAGCTG GTGGAAGCAG 
GTGCAGGACG GCAGCTATCA GGGCGAGCGT TTAGGTCTGA AAGGCTAA

Protein sequence

MRKILITGGA GFIGSALVRY IINETSDAVV VVDKLTYAGN LMSLAPVAQS ERFAFEKVDI 
CDRAELARVF TEHQPDCVMH LAAESHVDRS IDGPAAFIET NIVGTYTLLE AARTYWNALT 
EDKKSAFRFH HISTDEVYGD LHSTDDFFTE TTPYAPSSPY SASKASSDHL VRAWLRTYGL 
PTLITNCSNN YGPYHFPEKL IPLMILNALA GKPLPVYGNG QQIRDWLYVE DHARALYCVA 
TTGKVGETYN IGGHNERKNL DVVETICELL EELAPNKPHG VAHYRDLITF VADRPGHDLR 
YAIDASKIAR ELGWLPQETF ESGMRKTVQW YLANESWWKQ VQDGSYQGER LGLKG