Gene EcSMS35_2438 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_2438
Symbol	nuoF
ID	6144296
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	2487094
End bp	2488431
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	56%
IMG OID	641617310
Product	NADH dehydrogenase I subunit F
Protein accession	YP_001744482
Protein GI	170680196
COG category	[C] Energy production and conversion
COG ID	[COG1894] NADH:ubiquinone oxidoreductase, NADH-binding (51 kD) subunit
TIGRFAM ID	[TIGR01959] NADH-quinone oxidoreductase, F subunit

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	55
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAACA TTATCCGTAC TCCCGAAACG CATCCGCTGA CCTGGCGTCT GCGCGATGAC 
AAACAGCCAG TGTGGCTGGA CGAATACCGC AGCAAAAACG GTTACGAAGG GGCACGTAAA 
GCGCTGACCG GGCTGTCGCC TGACGAGATC GTCAACCAGG TGAAAGATGC TGGCCTGAAA 
GGGCGCGGCG GCGCAGGCTT CTCGACGGGC CTGAAGTGGA GCCTGATGCC GAAAGACGAA 
TCCATGAACA TCCGTTACCT GCTGTGTAAC GCTGATGAAA TGGAGCCGGG CACCTATAAA 
GACCGCCTGC TGATGGAGCA ACTGCCGCAC CTGCTGGTGG AAGGTATGCT TATCTCCGCG 
TTTGCGCTGA AAGCTTACCG TGGCTACATC TTCCTGCGCG GCGAATATAT TGAAGCGGCA 
GTGAATCTGC GCCGTGCCAT TGCCGAAGCC ACCGAAGCGG GTCTGCTTGG CAAAAACATT 
ATGGGAACAG GTTTCGACTT CGAATTGTTC GTCCATACCG GGGCAGGGCG CTACATCTGC 
GGTGAAGAAA CAGCGTTAAT CAACTCCCTG GAAGGGCGTC GCGCTAACCC ACGCTCGAAG 
CCTCCATTCC CGGCAACCTC CGGTGCATGG GGCAAACCGA CCTGTGTCAA TAACGTCGAA 
ACCCTGTGTA ACGTTCCGGC GATCCTTGCT AACGGCGTGG AGTGGTATCA GAACATCTCG 
AAAAGTAAAG ATGCTGGCAC CAAGCTGATG GGCTTCTCCG GTCGGGTGAA AAATCCGGGT 
CTGTGGGAAC TGCCGTTTGG CACCACCGCA CGCGAGATCC TCGAAGATTA CGCCGGTGGT 
ATGCGTGACG GTCTGAAATT CAAAGCCTGG CAGCCAGGCG GCGCGGGCAC CGACTTCCTG 
ACCGAAGCGC ACCTTGACCT GCCGATGGAA TTCGAAAGTA TCGGTAAAGC GGGAAGCCGT 
CTGGGTACGG CGCTGGCGAT GGCTGTTGAC CACGAGATCA ACATGGTGTC GCTGGTGCGT 
AACCTGGAAG AGTTTTTCGC CCGTGAGTCC TGCGGCTGGT GTACGCCGTG CCGCGACGGT 
CTGCCGTGGA GCGTGAAAAT TCTGCGCGCG CTGGAGCGTG GCGAAGGTCA GCCGGGCGAT 
ATCGAAACAC TTGAGCAACT GTGTCGATTC TTAGGTCCGG GTAAAACTTT CTGTGCCCAC 
GCACCTGGTG CAGTGGAGCC GTTACAGAGC GCCATCAAAT ATTTCCGCGA AGAATTTGAA 
GCGGGAATTA AACAGCCGTT CAGCAATACC CATTTGATTA ATGGGATTCA GCCGAACCTG 
CTGAAAGAGC GCTGGTAA

Protein sequence

MKNIIRTPET HPLTWRLRDD KQPVWLDEYR SKNGYEGARK ALTGLSPDEI VNQVKDAGLK 
GRGGAGFSTG LKWSLMPKDE SMNIRYLLCN ADEMEPGTYK DRLLMEQLPH LLVEGMLISA 
FALKAYRGYI FLRGEYIEAA VNLRRAIAEA TEAGLLGKNI MGTGFDFELF VHTGAGRYIC 
GEETALINSL EGRRANPRSK PPFPATSGAW GKPTCVNNVE TLCNVPAILA NGVEWYQNIS 
KSKDAGTKLM GFSGRVKNPG LWELPFGTTA REILEDYAGG MRDGLKFKAW QPGGAGTDFL 
TEAHLDLPME FESIGKAGSR LGTALAMAVD HEINMVSLVR NLEEFFARES CGWCTPCRDG 
LPWSVKILRA LERGEGQPGD IETLEQLCRF LGPGKTFCAH APGAVEPLQS AIKYFREEFE 
AGIKQPFSNT HLINGIQPNL LKERW