Gene Mext_1080 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_1080
Symbol
ID	5832768
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	-
Start bp	1177831
End bp	1179132
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	67%
IMG OID	641366874
Product	NADH dehydrogenase I subunit F
Protein accession	YP_001638555
Protein GI	163850512
COG category	[C] Energy production and conversion
COG ID	[COG1894] NADH:ubiquinone oxidoreductase, NADH-binding (51 kD) subunit
TIGRFAM ID	[TIGR01959] NADH-quinone oxidoreductase, F subunit

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	0.582859
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCGCCG ATCAGGATCG CATCTTCACC AATCTCTACG GCCTGCACTC GCCGGGGCTT 
GAGGCCGCGA AGAAGCGCGG CGCCTGGGAC GGAACCAAGT TCCTCCTCGA CATGGGCCGT 
GACTGGATCA TCGACGAGAT GAAGGGCTCC GGCCTGCGCG GCCGTGGTGG CGCGGGCTTT 
CCCACCGGCC TCAAATGGTC GTTCATGCCC AAGAAGTCCG ACGGGCGCCC GCACTACCTC 
GTCGTCAACG CCGACGAATC GGAGCCGGGC ACCTGCAAGG ACCGGGAGAT CATGCGGCAC 
GATCCGCATC TCCTGATCGA GGGCTGCCTG CTGGCCTCCT TCGCCATGGG GGCGCATGCC 
TGCTACATCT ACATCCGCGG CGAGTACGTG GCGGAGAAGT TCGCCCTTCA GCGCGCGGTG 
GACGAGGCCT ACGAGGCGCG CCTCGTCGGG CCGTCGAACA TCCACGACTA CCCGTTCGAC 
ATCTACGTCC ACCACGGCGC GGGCGCTTAC ATCTGCGGCG AGGAAACGGC GCTGATCGAG 
AGCCTGGAAG GCAAGAAGGG GATGCCGCGG CTGAAGCCGC CATTCCCCGC CAATATGGGC 
CTCTATGGCT GCCCCACGAC CGTCAATAAC GTCGAATCGA TCGCGGTGGC CGGCACGATC 
CTGCGCCGCG GCGGCGCGTG GTTCGCCGGC CTCGGCGGTA AGAACAACAC CGGCACCAAG 
CTGTTCTGCG TCTCGGGCCA CGTCAACAAG CCCTGCAACG TCGAGGAAGA GCTCGGCATC 
ACCTTCCGCG AGCTGATCGA TAAGCATTGC GGCGGCATGC GCGGCGGCTG GGACAATCTG 
CTCTGCTCCA TCCCCGGCGG CTCCTCGGTG CCGCTGGTGC CGGCCGAGCA GATCATCGAC 
GCCAAGATGG ACTTCGACAC CCTGCGCAAC CTCGGCTCGG GGCTGGGCAC CGCGGCGGTG 
ATCGTGCTCG ACAAATCGAC CGACATCGTC GGCGCGATCG CCCGCATCTC GTACTTCTAC 
AAGCACGAGA GCTGCGGCCA GTGCACGCCC TGCCGCGAGG GCACCGGCTG GATGTGGCGC 
GTGCTGACCC GCATGGCTGC CGGCCGGGCG CAGAAGCGCG AGATCGACAT GCTCCTGGAA 
GTCACCAAGC AGGTCGAGGG CCACACGATC TGCGCGCTGG GCGACGCCGC GGCATGGCCG 
ATCCAGGGCC TGATCCGGCA CTTCCGCCCC GAGATTGAGA AGCGGATCGA CCAGTACAGC 
GCCAACCCGC ACATGGATGC GGTGCCGATG GCGGCGGAGT GA

Protein sequence

MLADQDRIFT NLYGLHSPGL EAAKKRGAWD GTKFLLDMGR DWIIDEMKGS GLRGRGGAGF 
PTGLKWSFMP KKSDGRPHYL VVNADESEPG TCKDREIMRH DPHLLIEGCL LASFAMGAHA 
CYIYIRGEYV AEKFALQRAV DEAYEARLVG PSNIHDYPFD IYVHHGAGAY ICGEETALIE 
SLEGKKGMPR LKPPFPANMG LYGCPTTVNN VESIAVAGTI LRRGGAWFAG LGGKNNTGTK 
LFCVSGHVNK PCNVEEELGI TFRELIDKHC GGMRGGWDNL LCSIPGGSSV PLVPAEQIID 
AKMDFDTLRN LGSGLGTAAV IVLDKSTDIV GAIARISYFY KHESCGQCTP CREGTGWMWR 
VLTRMAAGRA QKREIDMLLE VTKQVEGHTI CALGDAAAWP IQGLIRHFRP EIEKRIDQYS 
ANPHMDAVPM AAE