Gene Nmul_A1238 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1238
Symbol
ID	3785577
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	1423800
End bp	1424789
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	55%
IMG OID	637811323
Product	urease accessory protein UreD
Protein accession	YP_411933
Protein GI	82702367
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0829] Urease accessory protein UreH
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAGTTATT CCGGGAGCGC CATCTTGAAA TCAGCCGCAA AAACCCATTT GAACCCGCCT 
GATGGGAATT CGACACCTTC ATCCGGCAGT ATTGCTACTC TGTGCCCGCC CACCTCTTCT 
GAAGGAAGGC CATCGGATCC GAAGGTGAAT ATGGCTTCAG ATTCTCCATT GAGAGCTCAT 
TTGCGGTTGA AGTTTGCGGA GAGTTCCGGC ATCACCCGCA TGGTGGAGCG AGATCATCAT 
GGCCCCTTGT TGGTGCAGAA ACCTCTCTAT CCGGAGGGTT ATGAGGTATG CCAAGCTGTT 
GTCATACACC CGCCGGGAGG CGTGGTCGCA GGGGATGAAT TGGGAATACG AGTACATGTC 
GGTCCATCCG CTCATGCTCA GATAACTTCT CCCGGCGCAA CAAAATGGTA CAAATCCAAA 
GGTCGGACCG CACGCCAGCA CGTTTACCTG CATGCGGAAG CAGGCGGTGT ACTGGAGTGG 
ATGCCGCAGG AAACGATTTT TTTCAATAAT GCAAGAGTGA TGCTCCATCA CGAGGTCGAG 
CTGGAGAAAG ATTCGGTTTA CATGAGTTGC GAGATTCTAT GCTTTGGTCG TACGGCATTC 
GGAGAATCGT TCGATAGCGG TGAGATAAAA CAGCATACGA GTATCCGCCA GGAGGGAAAG 
CTGGTCTGGT TTGAGAAGCT TCGTCTGGAG GGCGGAAGCA AAGCGATGAA TGGAAGGCTT 
GCACTTGCCG GCCGCGCCGT TTGCGCCACT TTTATCATGA GTGGCAAACC CCTTCCAGCG 
CAGGCGATCG ATCTTGTACG GGAAGAGGCG GTGCGCATCG GCGGAGAATC GGGGCAGGTG 
GGGATTACCC AATTGAAATC GCTGCTGGTG GCACGTTTTC TGGGAGATTC GAGTGAAGTG 
GCCAGACATG TGATGCTTTG CATCTGGCGG GCCGTACGCC CCATCACGCT CGGCCGGCCT 
GCGATCGTGC CGCGCAGCTG GAATACCTGA

Protein sequence

MSYSGSAILK SAAKTHLNPP DGNSTPSSGS IATLCPPTSS EGRPSDPKVN MASDSPLRAH 
LRLKFAESSG ITRMVERDHH GPLLVQKPLY PEGYEVCQAV VIHPPGGVVA GDELGIRVHV 
GPSAHAQITS PGATKWYKSK GRTARQHVYL HAEAGGVLEW MPQETIFFNN ARVMLHHEVE 
LEKDSVYMSC EILCFGRTAF GESFDSGEIK QHTSIRQEGK LVWFEKLRLE GGSKAMNGRL 
ALAGRAVCAT FIMSGKPLPA QAIDLVREEA VRIGGESGQV GITQLKSLLV ARFLGDSSEV 
ARHVMLCIWR AVRPITLGRP AIVPRSWNT