Gene EcHS_A2182 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A2182
Symbol	rfbB1
ID	5594768
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	2160574
End bp	2161638
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	59%
IMG OID	640921315
Product	dTDP-glucose 4,6-dehydratase
Protein accession	YP_001458854
Protein GI	157161536
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1088] dTDP-D-glucose 4,6-dehydratase
TIGRFAM ID	[TIGR01181] dTDP-glucose 4,6-dehydratase

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	0.0103955
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGATTC TTGTCACCGG TGGTGCAGGC TTTATCGGCT CTGCTGTAGT TCGTCATATC 
ATTGAAAATA CCCGGGATGA AGTCCGCGTG ATGGACTGCC TGACCTATGC CGGCAACCTC 
GAATCCCTGG CGCCGGTGGC CGGGAGCGAA CGCTACTCGT TTTCCCAGAC CGATATCACC 
GATGCCGCTG CCGTGGCGGC CCAGTTCAGC GAGTTCCGCC CGGATATCGT GATGCATCTG 
GCGGCAGAAA GTCATGTGGA CCGTTCCATT GATGGCCCGG CCGCCTTCAT CCAGACCAAC 
GTGATCGGCA CCTTCACTCT GCTGGAGGCG GCCCGTCACT ACTGGTCCGG GCTTGGGGAC 
GCGCAGAAGC AGGCCTTCCG CTTCCACCAT ATTTCCACCG ATGAGGTGTA CGGCGACCTG 
CACGGCACCG ATGACCTGTT CACCGAAGAG ACTCCGTACG CCCCGAGCAG CCCGTACTCT 
GCCTCCAAAG CGGGCAGCGA CCATCTGGTT CGCGCCTGGA ACCGCACCTA CGGCCTGCCG 
GTGGTGGTGA CCAACTGCTC CAACAACTAT GGTCCGTATC ACTTCCCGGA GAAACTGATC 
CCGCTGACTA TCCTTAATGC CCTGGCGGGT AAACCCCTGC CGGTGTATGG CAACGGGGAG 
CAGATCCGTG ACTGGCTGTA TGTTGAGGAC CATGCCCGTG CGCTGTATAA AGTGGCGACC 
GAAGGCAAGA GCGGCGAAAC CTACAATATT GGCGGTCATA ACGAGCGTAA AAATATCGAT 
GTGGTGCGCA CCATCTGCGC CATTCTCGAC AAGGTGGTGG CGCAGAAGCC GGGCAACATC 
GCCCACTTCG CTGACCTGAT CACTTTTGTC ACCGACCGTC CGGGACACGA CCTGCGTTAT 
GCCATTGATG CCGCGAAAAT TCAGCGCGAT CTGGGCTGGG TGCCGCAGGA GACGTTCGAG 
AGCGGGATTG AAAAAACCGT GCACTGGTAT CTTAACAACC AGACCTGGTG GCAGCGCGTG 
CTGGATGGCT CCTATGCCGG TGAGCGTCTG GGCCTAAATA ACTGA

Protein sequence

MKILVTGGAG FIGSAVVRHI IENTRDEVRV MDCLTYAGNL ESLAPVAGSE RYSFSQTDIT 
DAAAVAAQFS EFRPDIVMHL AAESHVDRSI DGPAAFIQTN VIGTFTLLEA ARHYWSGLGD 
AQKQAFRFHH ISTDEVYGDL HGTDDLFTEE TPYAPSSPYS ASKAGSDHLV RAWNRTYGLP 
VVVTNCSNNY GPYHFPEKLI PLTILNALAG KPLPVYGNGE QIRDWLYVED HARALYKVAT 
EGKSGETYNI GGHNERKNID VVRTICAILD KVVAQKPGNI AHFADLITFV TDRPGHDLRY 
AIDAAKIQRD LGWVPQETFE SGIEKTVHWY LNNQTWWQRV LDGSYAGERL GLNN