Gene Rmet_4300 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rmet_4300
Symbol	nuoF
ID	4041158
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cupriavidus metallidurans CH34
Kingdom	Bacteria
Replicon accession	NC_007974
Strand	-
Start bp	893833
End bp	895077
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	62%
IMG OID	637979722
Product	NADH:ubiquinone oxidoreductase complex I, chain F
Protein accession	YP_586435
Protein GI	94313226
COG category	[C] Energy production and conversion
COG ID	[COG1894] NADH:ubiquinone oxidoreductase, NADH-binding (51 kD) subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0070015
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGGAAAAGC TGAATCAGGT TCTCCTGAGG GACGATGTCC GCGTTGGTGC GGACCTGGAG 
GCATGGCTCG CAATTGGCGG AGGAGAGGGG CTGGCCAAGG CCTTGTGCGA TCCAGGCGCA 
GTCATAGGCG AGATCGAGCA GGCCGATCTG CGCGGAATGG GCGGCGCCGG ATTTGCGACC 
CATCGCAAAT GGGCGCCGGT TGCCGCCGCG GCTGACGGCG ACAAAACCAT CATCTGCAAC 
GGCAACGAAG ATGAGCCGGG GACCTTCAAG GACCGCTTCC TGCTGGAGCA CACGCCACAT 
CAGGTGATCG AGGGTGCCCT CATCGCCGCG GCCGCCACGC GTGCCAACCA TATTGTCCTT 
TACGTCAACC CTCACCAGCA GCAGGCCATT GCGGTCATAC GACAGGCCGT CGGGCAATGG 
CAGGCGCACC CCCGGTACGC CGAACTCGAG CGACTGCTGG GCGCCCCCCT GTCGCTTGGC 
GTTGTACCGA GTTCAGGGCT ATACATCGGG GGCGAGGAGA CGGCGGTGAT CGCAAGCGTC 
GAGGGCGGAT TCCCGTTCCC GCGGCGCAAG CCGCCCTTTC CCAGTCAACA AGGCGTGCAT 
GGCGCGCCAA GCATCGTCAA CAACGTCGAA ACGCTAGCGC ATATACCAGG AATTCTTCGC 
CACGGTGCTC AGTGGTATCG CGATCTCGGC ATCGGTAACG CAACCGGAAC CAAACTCTAT 
TCACTCTCTG GCGACGTATT GCGCCCCGGT CTGTATGAAC TACCAATGGG AACGAGCCTG 
GAGTCCCTGG TGTTCGAGCA CGGTGGCGGC ATGTTGCAAG GCAAGGAGTT CAAGGCCGTC 
TTTACAGGGG GGCCCTCGAA TACTCTGCTG ACGAAGCGTG ACCTCGATGT CGCCCTGGAC 
TTTGATTCGG TGCGACTAAG ACGCTCACGT CTGGGAACGG GGGCGATGAT CGTTGTATCG 
GAAGGCACCA GCATTGTCCG CAAGGTCGCT GAATTTGTGA GCTTCTTCGC GCAAGGATCG 
TGCGGCCAAT GCCCACCGTG CAAAGGTGGC AGCTTCCAGT TGATGCGATT GCTGAACCGC 
ATCGATACGG GCCGCGGTGT GCATGCCGAT CTGGCAGCGC TGGAGAATCT GTGCCGCATC 
CTACCCGGCA GCGGCCGCTG CGGCCTCATC GACGGCGCCG TGACGGTGGT GGAGAGTTCC 
CTGCACCAGT TCCGTGAGGA GTACGAGGCG CTGCTTATGG CATAG

Protein sequence

MEKLNQVLLR DDVRVGADLE AWLAIGGGEG LAKALCDPGA VIGEIEQADL RGMGGAGFAT 
HRKWAPVAAA ADGDKTIICN GNEDEPGTFK DRFLLEHTPH QVIEGALIAA AATRANHIVL 
YVNPHQQQAI AVIRQAVGQW QAHPRYAELE RLLGAPLSLG VVPSSGLYIG GEETAVIASV 
EGGFPFPRRK PPFPSQQGVH GAPSIVNNVE TLAHIPGILR HGAQWYRDLG IGNATGTKLY 
SLSGDVLRPG LYELPMGTSL ESLVFEHGGG MLQGKEFKAV FTGGPSNTLL TKRDLDVALD 
FDSVRLRRSR LGTGAMIVVS EGTSIVRKVA EFVSFFAQGS CGQCPPCKGG SFQLMRLLNR 
IDTGRGVHAD LAALENLCRI LPGSGRCGLI DGAVTVVESS LHQFREEYEA LLMA