Gene EcHS_A1430 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A1430
Symbol
ID	5591894
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	1424282
End bp	1425337
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	55%
IMG OID	640920585
Product	gfo/idh/mocA family protein
Protein accession	YP_001458144
Protein GI	157160826
COG category	[R] General function prediction only
COG ID	[COG0673] Predicted dehydrogenases and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	54
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAAAGTG CAATGACAAG CTCTCCGCTG CGGGTCGCGA TAATAGGCGC AGGCCAGGTG 
GCGGATAAGG TTCATGCTTC GTACTACTGC ACCCGCAACG ATCTGGAACT GGTGGCTGTC 
TGTGACAGCC GCCTTTCCCA GGCGCAGGCG CTGGCAGAAA AATACGGGAA TGCATCCGTG 
TGGGACGATC CGCAGGCCAT GCTGCTGGCG GTGAAACCTG ATGTGGTTAG CGTCTGCTCA 
CCTAACCGTT TTCATTACGA ACATACCCTG ATGGCACTGG AAGCGGGCTG CCATGTGATG 
TGCGAAAAAC CGCCCGCCAT GACGCCAGAA CAGGCGCGGG AAATGTGCGA TACCGCGCGC 
AAACTGGGCA AGGTGCTGGC CTACGACTTT CACCATCGTT TTGCGCTCGA TACGCAACAG 
CTGCGTGAAC AGGTGACCAA CGGCGTTTTG GGAGAGATTT ACGTTACCAC CGCCCGCGCC 
CTGCGTCGCT GCGGCGTTCC CGGCTGGGGT GTCTTTACCA ATAAAGAACT GCAGGGTGGT 
GGCCCGCTGA TCGACATCGG CATTCATATG CTGGATGCTG CGATGTATGT GCTGGGCTTT 
CCGGCGGTGA AAAGCGTGAA TGCGCATAGC TTTCAAAAGA TCGGCACGCA AAAGAGCTGT 
GGTCAATTTG GTGAGTGGGA TCCGGCAACT TACAGCGTCG AAGATTCGCT GTTTGGCACC 
ATTGAATTTC ATAACGGCGG CATTCTGTGG CTGGAAACGT CATTTGCACT CAACATCCGC 
GAACAGTCGA TTATGAACGT CAGCTTTTGT GGTGATAAAG CTGGTGCGAC GCTGTTTCCA 
GCACATATCT ACACCGATAA CAACGGTGAA TTAATGACGC TGATGCAACG GGAAATGGCA 
GACGACAACC GCCATTTGCG CAGCATGGAA GCCTTTATCA ATCACGTACA GGGCAAGCCC 
GTGATGATAG CCGACGCCGA GCAGGGGTAC ATCATCCAGC AACTGGTGGC GGCGTTGTAT 
CAATCCGCAG AAACAGGGAC GCGTGTGGAA TTATGA

Protein sequence

MKSAMTSSPL RVAIIGAGQV ADKVHASYYC TRNDLELVAV CDSRLSQAQA LAEKYGNASV 
WDDPQAMLLA VKPDVVSVCS PNRFHYEHTL MALEAGCHVM CEKPPAMTPE QAREMCDTAR 
KLGKVLAYDF HHRFALDTQQ LREQVTNGVL GEIYVTTARA LRRCGVPGWG VFTNKELQGG 
GPLIDIGIHM LDAAMYVLGF PAVKSVNAHS FQKIGTQKSC GQFGEWDPAT YSVEDSLFGT 
IEFHNGGILW LETSFALNIR EQSIMNVSFC GDKAGATLFP AHIYTDNNGE LMTLMQREMA 
DDNRHLRSME AFINHVQGKP VMIADAEQGY IIQQLVAALY QSAETGTRVE L