Gene EcHS_A2433 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A2433
Symbol	nuoF
ID	5592078
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	2441789
End bp	2443126
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	56%
IMG OID	640921556
Product	NADH dehydrogenase I subunit F
Protein accession	YP_001459090
Protein GI	157161772
COG category	[C] Energy production and conversion
COG ID	[COG1894] NADH:ubiquinone oxidoreductase, NADH-binding (51 kD) subunit
TIGRFAM ID	[TIGR01959] NADH-quinone oxidoreductase, F subunit

Plasmid Coverage information

Num covering plasmid clones	54
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAACA TTATCCGTAC TCCCGAAACG CATCCGCTGA CCTGGCGTCT GCGCGATGAC 
AAACAGCCAG TGTGGCTGGA CGAATACCGC AGCAAAAACG GTTACGAAGG GGCGCGTAAG 
GCGCTGACCG GGCTGTCTCC GGACGAAATC GTTAATCAGG TAAAAGACGC TGGTCTGAAA 
GGGCGCGGCG GCGCGGGCTT TTCGACTGGC CTGAAGTGGA GCCTGATGCC GAAAGACGAA 
TCCATGAACA TCCGTTACCT GCTGTGTAAC GCCGATGAAA TGGAGCCGGG CACCTATAAA 
GACCGCCTGT TGATGGAGCA ACTGCCGCAC CTGCTGGTGG AAGGTATGCT CATCTCCGCG 
TTTGCGCTGA AAGCTTACCG TGGCTACATC TTCCTGCGTG GCGAATATAT CGAAGCGGCA 
GTAAATCTGC GCCGCGCCAT TGCCGAAGCC ACTGAAGCGG GCTTGCTTGG CAAAAACATT 
ATGGGAACAG GTTTCGACTT CGAACTGTTC GTCCATACCG GGGCAGGGCG CTATATCTGC 
GGGGAAGAAA CAGCGTTAAT CAACTCCCTG GAAGGGCGTC GTGCTAACCC ACGCTCGAAA 
CCCCCCTTCC CGGCAACCTC CGGCGTATGG GGCAAACCGA CCTGTGTCAA CAACGTCGAA 
ACCCTGTGTA ACGTTCCGGC GATCCTCGCT AACGGCGTGG AGTGGTATCA GAACATCTCG 
AAAAGTAAAG ATGCTGGCAC CAAGCTGATG GGCTTCTCCG GTCGGGTGAA AAATCCGGGA 
CTGTGGGAAC TGCCGTTTGG TACTACCGCG CGCGAGATCC TCGAAGATTA CGCCGGTGGT 
ATGCGTGACG GTCTGAAATT CAAAGCCTGG CAGCCAGGCG GCGCGGGCAC CGACTTCCTG 
ACCGAAGCGC ACCTTGACCT GCCGATGGAA TTCGAAAGTA TCGGTAAAGC GGGAAGCCGT 
CTGGGTACGG CGCTGGCGAT GGCGGTTGAC CATGAGATCA ACATGGTGTC GCTGGTGCGT 
AACCTGGAAG AGTTTTTCGC CCGTGAGTCC TGCGGCTGGT GTACGCCGTG CCGCGACGGT 
CTGCCGTGGA GCGTGAAAAT TCTGCGTGCG CTGGAGCGTG GTGAAGGTCA GCCGGGCGAT 
ATCGAAACAC TTGAGCAACT GTGTCGATTC TTAGGCCCGG GTAAAACTTT CTGTGCCCAC 
GCACCTGGTG CAGTGGAGCC GTTACAGAGC GCCATCAAAT ATTTCCGCGA AGAATTTGAG 
GCGGGAATCA AACAGCCGTT CAGCAATACC CATTTGATTA ATGGGATTCA GCCGAACCTG 
CTGAAAGAGC GCTGGTAA

Protein sequence

MKNIIRTPET HPLTWRLRDD KQPVWLDEYR SKNGYEGARK ALTGLSPDEI VNQVKDAGLK 
GRGGAGFSTG LKWSLMPKDE SMNIRYLLCN ADEMEPGTYK DRLLMEQLPH LLVEGMLISA 
FALKAYRGYI FLRGEYIEAA VNLRRAIAEA TEAGLLGKNI MGTGFDFELF VHTGAGRYIC 
GEETALINSL EGRRANPRSK PPFPATSGVW GKPTCVNNVE TLCNVPAILA NGVEWYQNIS 
KSKDAGTKLM GFSGRVKNPG LWELPFGTTA REILEDYAGG MRDGLKFKAW QPGGAGTDFL 
TEAHLDLPME FESIGKAGSR LGTALAMAVD HEINMVSLVR NLEEFFARES CGWCTPCRDG 
LPWSVKILRA LERGEGQPGD IETLEQLCRF LGPGKTFCAH APGAVEPLQS AIKYFREEFE 
AGIKQPFSNT HLINGIQPNL LKERW