Gene ECH74115_3421 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_3421
Symbol	nuoH
ID	6970282
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	3163997
End bp	3164974
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	55%
IMG OID	643387228
Product	NADH dehydrogenase subunit H
Protein accession	YP_002271691
Protein GI	209399728
COG category	[C] Energy production and conversion
COG ID	[COG1005] NADH:ubiquinone oxidoreductase subunit 1 (chain H)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.950674
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	72
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTTGGA TATCACCGGA ACTGATTGAG ATCCTGCTGA CCATCCTCAA AGCGGTGGTG 
ATCCTGCTGG TGGTTGTCAC CTGCGGGGCA TTCATGAGCT TTGGCGAACG TCGCCTGCTG 
GGTCTGTTCC AGAACCGTTA CGGACCTAAC CGTGTTGGCT GGGGTGGTTC GCTCCAGCTG 
GTTGCGGACA TGATCAAAAT GTTCTTTAAA GAAGACTGGA TCCCGAAATT CTCGGATCGC 
GTCATCTTTA CCCTGGCACC GATGATTGCC TTTACCTCGC TGCTGCTGGC CTTTGCGATT 
GTGCCAGTCA GTCCGGGTTG GGTGGTTGCC GACCTGAACA TCGGGATTTT GTTCTTCCTG 
ATGATGGCCG GTCTGGCGGT TTACGCGGTG CTGTTTGCGG GCTGGTCAAG TAACAACAAA 
TACTCGCTGC TCGGTGCGAT GCGTGCTTCT GCGCAGACCC TGAGCTACGA AGTGTTCCTC 
GGGCTTTCCC TGATGGGCGT GGTGGCGCAG GCCGGTTCAT TCAACATGAC CGACATCGTC 
AACAGCCAGG CGCATGTGTG GAACGTCATC CCGCAATTCT TTGGTTTTAT TACCTTTGCC 
ATCGCGGGCG TGGCGGTGTG TCACCGTCAC CCGTTTGACC AGCCGGAAGC CGAGCAGGAA 
CTGGCGGATG GTTACCACAT TGAATATTCC GGTATGAAGT TCGGTCTGTT CTTCGTGGGT 
GAGTACATCG GGATTGTGAC CATCTCTGCA TTGATGGTGA CGCTGTTCTT CGGTGGCTGG 
CAAGGCCCGT TGTTACCGCC ATTCATCTGG TTCGCGCTGA AAACCGCGTT CTTTATGATG 
ATGTTCATTT TGATTCGTGC GTCGTTACCG CGTCCGCGTT ATGACCAGGT AATGTCCTTC 
GGCTGGAAAA TCTGCCTGCC GCTGACGCTG ATCAACTTGC TGGTAACGGC GGCTGTCATT 
CTCTGGCAGG CGCAATAA

Protein sequence

MSWISPELIE ILLTILKAVV ILLVVVTCGA FMSFGERRLL GLFQNRYGPN RVGWGGSLQL 
VADMIKMFFK EDWIPKFSDR VIFTLAPMIA FTSLLLAFAI VPVSPGWVVA DLNIGILFFL 
MMAGLAVYAV LFAGWSSNNK YSLLGAMRAS AQTLSYEVFL GLSLMGVVAQ AGSFNMTDIV 
NSQAHVWNVI PQFFGFITFA IAGVAVCHRH PFDQPEAEQE LADGYHIEYS GMKFGLFFVG 
EYIGIVTISA LMVTLFFGGW QGPLLPPFIW FALKTAFFMM MFILIRASLP RPRYDQVMSF 
GWKICLPLTL INLLVTAAVI LWQAQ