Gene EcHS_A4005 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A4005
Symbol	rfbB2
ID	5592287
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	4000935
End bp	4002002
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	53%
IMG OID	640923109
Product	dTDP-glucose 4,6-dehydratase
Protein accession	YP_001460580
Protein GI	157163262
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1088] dTDP-D-glucose 4,6-dehydratase
TIGRFAM ID	[TIGR01181] dTDP-glucose 4,6-dehydratase

Plasmid Coverage information

Num covering plasmid clones	55
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAAAAA TTCTGATAAC AGGTGGTGCC GGGTTTATTG GCTCGGCGCT GGTGCGTTAT 
ATCATCAACG AAACGAGCGA TGCGGTGGTA GTGGTCGATA AGCTGACCTA CGCCGGAAAC 
CTGATGTCGC TGGCACCGGT CGCGCAAAGC GAGCACTTTG CCTTTGAGAA AGTTGATATC 
TGCGATCGGG CAGAACTGGC ACGCGTATTC ACTGAGCATC AGCCAGACTG TGTCATGCAT 
CTGGCAGCCG AAAGCCATGT TGACCGTTCT ATTGACGGCC CGGCAGCGTT TATTGAAACC 
AACATTGTCG GGACTTATAC ATTGCTTGAA GCGGCGCGGG CTTACTGGAA TACGCTGACG 
GAAGATAAAA AATCAGCGTT CCGTTTTCAT CATATCTCCA CCGACGAAGT ATATGGTGAC 
CTGCACTCGA CGGATGATTT CTTCACCGAA ACCACGCCGT ATGCGCCGAG CAGCCCTTAT 
TCCGCGTCAA AAGCCAGCAG CGACCATCTG GTGCGCGCCT GGCTGCGGAC CTACGGTCTG 
CCGACGCTGA TCACCAACTG CTCGAATAAC TACGGTCCTT ACCACTTTCC GGAAAAACTG 
ATCCCGCTGA TGATCCTCAA CGCGCTGGCG GGTAAACCGC TGCCGGTATA TGGCAACGGG 
CAGCAAATCC GTGACTGGCT GTATGTGGAA GATCACGCCC GCGCGCTGTA TTGCGTGGCG 
ACCACCGGGA AAGTCGGTGA AACCTATAAT ATTGGTGGTC ACAACGAGCG TAAGAATCTC 
GATGTTGTGG AAACCATTTG CGAGCTGCTG GAAGAACTGG CTCCGAACAA GCCGCACGGC 
GTGGTGCACT ATCGTGACTT GATCACCTTT GTCGCTGACC GTCCGGGGCA TGATCTGCGT 
TATGCCATTG ATGCTTCGAA AATTGCCCGT GAACTTGGTT GGCTGCCACA GGAAACCTTT 
GAAAGTGGAA TGCGTAAAAC GGTGCAGTGG TATCTGGCTA ATGAAAGCTG GTGGAAGCAG 
GTGCAGGACG GCAGCTATCA GGGCGAGCGT TTAGGTCTGA AAGGCTAA

Protein sequence

MRKILITGGA GFIGSALVRY IINETSDAVV VVDKLTYAGN LMSLAPVAQS EHFAFEKVDI 
CDRAELARVF TEHQPDCVMH LAAESHVDRS IDGPAAFIET NIVGTYTLLE AARAYWNTLT 
EDKKSAFRFH HISTDEVYGD LHSTDDFFTE TTPYAPSSPY SASKASSDHL VRAWLRTYGL 
PTLITNCSNN YGPYHFPEKL IPLMILNALA GKPLPVYGNG QQIRDWLYVE DHARALYCVA 
TTGKVGETYN IGGHNERKNL DVVETICELL EELAPNKPHG VVHYRDLITF VADRPGHDLR 
YAIDASKIAR ELGWLPQETF ESGMRKTVQW YLANESWWKQ VQDGSYQGER LGLKG