Gene GSU3430 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU3430
Symbol	nuoM-2
ID	2686865
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	-
Start bp	3775526
End bp	3777016
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	65%
IMG OID	637128125
Product	NADH dehydrogenase I, M subunit
Protein accession	NP_954470
Protein GI	39998519
COG category	[C] Energy production and conversion
COG ID	[COG1008] NADH:ubiquinone oxidoreductase subunit 4 (chain M)
TIGRFAM ID	[TIGR01972] proton-translocating NADH-quinone oxidoreductase, chain M

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTTCCT ACTCCATCCT CACCATCTTG ATCCTCCTCC CCCTGGCGGG GTGCTTCTGC 
CTGGCGCCGG TCTGGAACCG TCCGGAGTGG GCCCGCCCCC TCGCCCTGGG GATTGCCGTG 
GCGGAACTGG CCCTGGCCGG CTGGGTCCTC GTCGCCGCGC CGGGAATGCC GCCGGCGCCG 
GGTGCCGCAG CAGGGTATTT TCTCTGGGAA GATGCCGCCT GGATCGAGCG GTTCGGCATC 
CGGTACCTGC TGGGGATGGA CGGGATCAGC CTCCTCATGG TGGCCCTCAC CGCCTTCACC 
ACGGTGGTGG CGATGCTCGT TTCGTGGCGC GGCATCACCG AGCGGGCCAC GCTCCACTAC 
TTCCTGATCC TTCTCATGGA GAGCGGGATC ATGGGAGTGT TCCTTTCCCT TGACCTGGTC 
CTCTTCTACC TCTTCTGGGA AGTGATGCTG ATCCCCATGT TCTTCTTGAT CGGCATCTGG 
GGCCACGGCC GACGCATCTA CTCGGCAGTT AAGTTCTTCC TTTATACCCT GGTGGGCTCG 
CTCCTGATGC TGCTGGCCAT CATCGGGGTC TACCTCATTC ATGGCGATGC CACCGGCACC 
TTCACCTTTG CCCTGCCGCT CCTGGCCAAG TCACCCATTG CCCATGCCGC GGCTCCGTGG 
CTTTTCGGGG CGTTTCTGCT GGCCTTCGCC ATCAAGTTTC CGCTGTTTCC GGTCCACACC 
TGGCTCCCGG ACGCCCACAC CGACGCCCCC ACGGCCGGCA GCGTGATCCT GGCGGCGCTG 
CTCCTGAAGA CCGGGGCCTA CGGTCTGGTC CGCTTCGGCT ACCCGCTCTT TCCCGAGGCG 
GCCAAAGGAT TCACGCCGCT CCTCTACGTG CTGGCAATCA TCGGCATCCT CTATGCCTCG 
TGGATCGCCT ACGCCCAGGA GGACATGAAA CGGATGGTGG CCTACTCCAG CGTTGGGCAC 
ATGGGGTTCG TCGCCCTCGG GATCGCCTCC TGGGGGCCGG TGGCCCTGTC GGGCTCCATT 
CTCCAGATGG TGAACCACGG CTTCACCACC GCCGCTCTCT TCGCCCTGGT GGGGATGCTG 
GACGAGCGCG CCCACACCCG GGAGGTGTCG GCGTTCGGCG GACTCTGGGG AACCATGCCG 
GCCTTCTCCT TTTTCTTTCT CTTCTTCGCC ATGGCTTCGG CGGGGCTGCC GGGGCTCAAC 
AACTTCGTGG GAGAGTTCCT GATCCTGGTG GGGGTCTTCC GGATCACGCC AGCAGCCGGG 
GCAATCGCCT TCCTCGGTAT CGTGCTGCCG CTTATCTACA CCGTGCGACT CGTGCAGGAG 
GTTCTCTTCC AGACGGAACG GCGGCCACTG CGCCTGCCCG ACCTGACCCT GCGTGAGGGG 
GCGGTGCTGG CCGTACTGGC CGTGATCGAT CTCTACATCG GGGTCCATCC GAAACCGCTC 
CTGGATATCC TCAAGGTGCC GGTGGCGCTG CTGACGGGGG TGGCACCGTG A

Protein sequence

MTSYSILTIL ILLPLAGCFC LAPVWNRPEW ARPLALGIAV AELALAGWVL VAAPGMPPAP 
GAAAGYFLWE DAAWIERFGI RYLLGMDGIS LLMVALTAFT TVVAMLVSWR GITERATLHY 
FLILLMESGI MGVFLSLDLV LFYLFWEVML IPMFFLIGIW GHGRRIYSAV KFFLYTLVGS 
LLMLLAIIGV YLIHGDATGT FTFALPLLAK SPIAHAAAPW LFGAFLLAFA IKFPLFPVHT 
WLPDAHTDAP TAGSVILAAL LLKTGAYGLV RFGYPLFPEA AKGFTPLLYV LAIIGILYAS 
WIAYAQEDMK RMVAYSSVGH MGFVALGIAS WGPVALSGSI LQMVNHGFTT AALFALVGML 
DERAHTREVS AFGGLWGTMP AFSFFFLFFA MASAGLPGLN NFVGEFLILV GVFRITPAAG 
AIAFLGIVLP LIYTVRLVQE VLFQTERRPL RLPDLTLREG AVLAVLAVID LYIGVHPKPL 
LDILKVPVAL LTGVAP