Gene Nmul_A1103 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1103
Symbol
ID	3784718
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	1269813
End bp	1271300
Gene Length	1488 bp
Protein Length	495 aa
Translation table	11
GC content	54%
IMG OID	637811188
Product	NADH dehydrogenase subunit M
Protein accession	YP_411798
Protein GI	82702232
COG category	[C] Energy production and conversion
COG ID	[COG1008] NADH:ubiquinone oxidoreductase subunit 4 (chain M)
TIGRFAM ID	[TIGR01972] proton-translocating NADH-quinone oxidoreductase, chain M

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.135594
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTGTTTG GTTTCCCCCT GTTAAGTCTG GTTATCTGGC TGCCTATCCT CGCCGGTGTT 
GCTGTACTCG CTACCGGTGG AGATCGTAAT GCTCCCCTTG CGCGCATGAT CGCCCTCGTC 
GGATCTATTG CGGGTTTTCT GGTGGCGATT CCGCTTTATA CCAGCTTCGA TCCGTCGACG 
AGCACTATGC AATTTGTCGA GAGCCATGTG TGGATCGAAC GCTTCAACGT CCACTATCAC 
CTCGGGGTGG ATGGAATCGC CATGCCCCTG ATACTGCTGA ATGCTTTTAC CACCCCTCTG 
GTAGTGATCG CGGGATGGGA AGTGATTACC CGGCGCGTAT CGCAGTATAT GGGGGCCTTT 
CTCATCATGT CCGGCATCGT CAACGGTGTT TTTTCGTCGC TGGATGCAAT TCTCTTCTAT 
GTCTTCTGGG AAGCTTCCCT CATTCCGATG TTTCTTATCA TTGGCGTGTG GGGGGGACCC 
AACCGGGTTT ATGCGGCAAT CAAGTTTTTC CTTTATACGC TGCTCGGTTC ACTGCTGATG 
CTGGTGGCAT TCATCTATCT TTACCAGGTT TCCGAGGGTA GCTTCTCGAT ACTTGAATAT 
CATAAACTGC CGTTGTCGAT GGCATCGCAG ATCCTGATAT TCATCGCCTT CCTGCTGGCT 
TTTGCTGTCA AAGTCCCCAT GTGGCCCGTC CATACGTGGC TACCCGACGC GCACGTGGAA 
GCGCCGACCG GAGGTTCGGT GGTGCTTGCC GCTATCCTGC TGAAAATGGG AGGCTACGGG 
TTCCTGCGGT TTTCGCTGCC GATCCTGCCG GATGCGAGTC ACCAGCTCGC GGGCATGATG 
ATCGCATTGT CGCTGATCGC GGTCGTCTAT ATCGGCCTGG TTGCCCTGGT GCAGGCGGAC 
ATGAAAAAGC TGATCGCCTA CTCATCGGTG GCACATATGG GTTTCGTCAC CCTCGGTTTT 
TTCCTGTTCA ATAATTACGG CCTCGAAGGC GCCATGGTCC AGATGGTTTC ACATGGTTTT 
ATTTCGGCTG CAATGTTTCT TTGTATTGGC GTCATGTATG ACAGGCTGCA TTCCCGCCAG 
ATCGTGGATT ATGGGGGAGT GGCGCACCGC ATGCCTGCCT TTGCCGCTTT TTTCATGCTG 
TTTGCCATGG CTAACTCCGG GTTGCCCGGC ACCAGCGGTT TCGTCGGCGA GTTCATGGTC 
ATCATGGCAT CGATGAAAGT GAATTTCTGG TATGCGTTTC TGGCCGCCAC GACGCTCATC 
ACAGGCGCAG CTTATACCCT GTGGATGTAC AAGCGCGTGA TATTCGGCGC CGTTGTACAT 
CCCGCAGTGG AGGAAATGAA AGATATCGGC GCGCGCGAGA TTCTTGTATT GACCGTACTC 
GCGGTGGCGG TATTGGGGAT GGGACTATAT CCGCTACCCT TGACGGAAGT CATGCATACC 
ACAGTTGATG ATTTACTTGC GCATGTTGCT CGCAGCAAAT TGCAGTGA

Protein sequence

MLFGFPLLSL VIWLPILAGV AVLATGGDRN APLARMIALV GSIAGFLVAI PLYTSFDPST 
STMQFVESHV WIERFNVHYH LGVDGIAMPL ILLNAFTTPL VVIAGWEVIT RRVSQYMGAF 
LIMSGIVNGV FSSLDAILFY VFWEASLIPM FLIIGVWGGP NRVYAAIKFF LYTLLGSLLM 
LVAFIYLYQV SEGSFSILEY HKLPLSMASQ ILIFIAFLLA FAVKVPMWPV HTWLPDAHVE 
APTGGSVVLA AILLKMGGYG FLRFSLPILP DASHQLAGMM IALSLIAVVY IGLVALVQAD 
MKKLIAYSSV AHMGFVTLGF FLFNNYGLEG AMVQMVSHGF ISAAMFLCIG VMYDRLHSRQ 
IVDYGGVAHR MPAFAAFFML FAMANSGLPG TSGFVGEFMV IMASMKVNFW YAFLAATTLI 
TGAAYTLWMY KRVIFGAVVH PAVEEMKDIG AREILVLTVL AVAVLGMGLY PLPLTEVMHT 
TVDDLLAHVA RSKLQ