Gene ECH74115_1489 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_1489
Symbol	ndh
ID	6967778
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	1468783
End bp	1470087
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	52%
IMG OID	643385460
Product	NADH dehydrogenase
Protein accession	YP_002269954
Protein GI	209398186
COG category	[C] Energy production and conversion
COG ID	[COG1252] NADH dehydrogenase, FAD-containing subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	0.00503267
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

TTGACTACGC CATTGAAAAA AATTGTGATT GTCGGCGGCG GTGCTGGTGG GCTGGAAATG 
GCAACACAGC TGGGGCATAA GCTGGGACGC AAGAAAAAAG CCAAAATTAC GCTGGTCGAT 
CGTAACCACA GCCACCTGTG GAAACCGCTG CTGCACGAAG TAGCGACTGG CTCGCTTGAT 
GAAGGCGTCG ATGCGTTGAG CTATCTGGCC CATGCGCGCA ATCATGGTTT CCAGTTCCAG 
CTGGGTTCCG TCATTGATAT TGATCGTGAC GCGAAAACAA TCACTATTGC AGAACTGCGC 
GATGAGAAAG GTGAACTGCT GGTTCCGGAA CGTAAAATCG CCTATGACAC CCTGGTAATG 
GCGCTGGGTA GCACCTCTAA CGATTTCAAT ACACCAGGTG TCAAAGAGAA CTGCATTTTC 
CTCGATAACC CGCACCAGGC GCGTCGCTTT CACCAGGAGA TGCTGAATCT CTTCCTGAAA 
TACTCCGCCA ACCTGGGCGC AAATGGCAAA GTGAACATTG CGATTGTCGG CGGCGGCGCG 
ACGGGTGTAG AACTCTCCGC TGAATTGCAC AACGCGGTCA AGCAACTGCA CAGCTACGGT 
TACAAAGGCC TGACCAACGA AGCCCTGAAC GTAACGCTGG TAGAAGCGGG AGAACGTATT 
TTGCCTGCAT TACCGCCACG TATCTCTGCT GCGGCCCACA ACGAGCTAAC GAAACTTGGC 
GTTCGCGTTC TGACGCAAAC CATGGTCACC AGTGCTGATG AAGGCGGCCT GCACACTAAA 
GATGGCGAAT ATATTGAGGC TGATCTGATG GTATGGGCAG CCGGGATCAA AGCGCCAGAC 
TTCCTGAAAG ATATCGGTGG TCTTGAAACT AACCGTATCA ACCAGCTGGT GGTGGAACTG 
ACGCTGCAAA CCACCCGCGA TCCAGACATT TACGCTATTG GCGACTGCGC GTCATGCCCG 
CGTCCGGAAG GGGGCTTTGT TCCGCCGCGT GCTCAGGCTG CACACCAGAT GGCGACTTGC 
GCAATGAACA ACATTCTGGC GCAGATGAAC GGTAAGCTGC TGAAAAATTA TCAGTATAAA 
GATCATGGTT CGCTGGTATC GCTGTCGAAC TTCTCCACCG TTGGTAGCCT GATGGGTAAC 
CTGACGCGCG GCTCAATGAT GATTGAAGGA CGAATTGCGC GCTTTGTATA TATCTCGCTA 
TACCGAATGC ATCAGATTGC GCTGCATGGT TACTTTAAAA CCGGATTAAT GATGCTGGTG 
GGGAGTATTA ACCGCGTTAT CCGTCCGCGT TTGAAGTTGC ATTAA

Protein sequence

MTTPLKKIVI VGGGAGGLEM ATQLGHKLGR KKKAKITLVD RNHSHLWKPL LHEVATGSLD 
EGVDALSYLA HARNHGFQFQ LGSVIDIDRD AKTITIAELR DEKGELLVPE RKIAYDTLVM 
ALGSTSNDFN TPGVKENCIF LDNPHQARRF HQEMLNLFLK YSANLGANGK VNIAIVGGGA 
TGVELSAELH NAVKQLHSYG YKGLTNEALN VTLVEAGERI LPALPPRISA AAHNELTKLG 
VRVLTQTMVT SADEGGLHTK DGEYIEADLM VWAAGIKAPD FLKDIGGLET NRINQLVVEL 
TLQTTRDPDI YAIGDCASCP RPEGGFVPPR AQAAHQMATC AMNNILAQMN GKLLKNYQYK 
DHGSLVSLSN FSTVGSLMGN LTRGSMMIEG RIARFVYISL YRMHQIALHG YFKTGLMMLV 
GSINRVIRPR LKLH