Gene EcHS_A1232 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A1232
Symbol	ndh
ID	5595181
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	1229773
End bp	1231077
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	53%
IMG OID	640920392
Product	NADH dehydrogenase
Protein accession	YP_001457954
Protein GI	157160636
COG category	[C] Energy production and conversion
COG ID	[COG1252] NADH dehydrogenase, FAD-containing subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	60
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGACTACGC CATTGAAAAA AATTGTGATT GTCGGCGGCG GTGCTGGTGG GCTGGAAATG 
GCAACACAGC TGGGGCATAA GCTGGGACGC AAGAAAAAAG CCAAAATTAC GCTGGTCGAT 
CGTAACCACA GCCACCTGTG GAAACCGCTG CTGCACGAAG TGGCGACTGG CTCGCTTGAT 
GAAGGCGTCG ATGCGTTGAG CTATCTGGCC CATGCGCGCA ATCATGGTTT CCAGTTCCAG 
CTGGGTTCCG TCATTGATAT TGATCGTGAA GCGAAAACAA TCACTATTGC AGAACTGCGC 
GATGAGAAAG GTGAACTGCT GGTTCCGGAA CGTAAAATCG CCTATGACAC CCTGGTAATG 
GCGCTGGGTA GCACCTCTAA CGATTTCAAT ACGCCGGGTG TCAAAGAGAA CTGCATTTTC 
CTCGATAACC CGCACCAGGC GCGTCGCTTT CACCAGGAGA TGCTGAATCT CTTCCTGAAA 
TACTCCGCCA ACCTGGGCGC GAATGGCAAA GTGAACATTG CGATTGTCGG CGGCGGCGCG 
ACGGGTGTAG AACTCTCCGC TGAATTGCAC AACGCGGTCA AGCAACTGCA CAGCTACGGT 
TACAAAGGCC TGACCAACGA AGCCCTGAAC GTAACGCTGG TAGAAGCGGG AGAACGTATT 
TTGCCTGCGT TACCGCCACG TATCTCTGCT GCGGCCCACA ACGAGCTAAC GAAACTTGGC 
GTTCGCGTGC TGACGCAAAC CATGGTCACC AGTGCTGATG AAGGCGGCCT GCACACTAAA 
GATGGCGAAT ATATTGAGGC GGATCTGATG GTATGGGCAG CCGGGATCAA AGCGCCAGAC 
TTCCTGAAAG ATATCGGTGG TCTTGAAACT AACCGTATCA ACCAGCTGGT GGTGGAACCG 
ACGCTGCAAA CCACTCGCGA TCCAGACATT TACGCTATTG GCGACTGCGC GTCATGCCCG 
CGTCCGGAAG GGGGCTTTGT TCCGCCGCGT GCTCAGGCTG CACACCAGAT GGCGACTTGC 
GCAATGAACA ACATTCTGGC GCAGATGAAC GGTAAACCGC TGAAAAATTA TCAGTATAAA 
GATCATGGTT CGCTGGTATC GCTGTCGAAC TTCTCCACCG TTGGTAGCCT GATGGGTAAC 
CTGACGCGCG GCTCAATGAT GATTGAAGGA CGAATTGCGC GCTTTGTATA TATCTCGCTA 
TACCGAATGC ATCAGATTGC GCTGCATGGT TACTTTAAAA CCGGATTAAT GATGCTGGTG 
GGGAGTATTA ACCGCGTTAT CCGTCCGCGT TTGAAGTTGC ATTAA

Protein sequence

MTTPLKKIVI VGGGAGGLEM ATQLGHKLGR KKKAKITLVD RNHSHLWKPL LHEVATGSLD 
EGVDALSYLA HARNHGFQFQ LGSVIDIDRE AKTITIAELR DEKGELLVPE RKIAYDTLVM 
ALGSTSNDFN TPGVKENCIF LDNPHQARRF HQEMLNLFLK YSANLGANGK VNIAIVGGGA 
TGVELSAELH NAVKQLHSYG YKGLTNEALN VTLVEAGERI LPALPPRISA AAHNELTKLG 
VRVLTQTMVT SADEGGLHTK DGEYIEADLM VWAAGIKAPD FLKDIGGLET NRINQLVVEP 
TLQTTRDPDI YAIGDCASCP RPEGGFVPPR AQAAHQMATC AMNNILAQMN GKPLKNYQYK 
DHGSLVSLSN FSTVGSLMGN LTRGSMMIEG RIARFVYISL YRMHQIALHG YFKTGLMMLV 
GSINRVIRPR LKLH