Gene Nmul_A2482 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A2482
Symbol
ID	3784831
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	2833232
End bp	2834506
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	59%
IMG OID	637812573
Product	dihydroorotase
Protein accession	YP_413163
Protein GI	82703597
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR00857] dihydroorotase, multifunctional complex type

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACATCG CCATCCGCAA TGGTCGCGTC ATCGACCCGA AAAACAGCTT CGATCGCGTA 
ACGGACATTT ACATCCAGTC AGGCAAAATC GCCTCTCTCG GAGCCGTCCC GCCAGGCTTT 
GAGGCACGCC GGGAAATAAA CGCGCAGGGA TTGATCGTGT GTCCCGGGCT TGTGGATCTG 
TCGGCCCGGC TACGGGAACC CGGCCTGGAA TACAAGGCGA CGCTTGAATC GGAAATGGGA 
GCCGCGGTGG CGGGGGGTGT TACAAGCCTG GCATGTCCCC CCGATACCGA TCCTGTGCTG 
GACGAACCCG GGCTGGTGGA AATGCTGAAG TATCGCGCAA GGAGCCGCAA TCAGACGCGT 
GTGTATCCCA TTGGAGCGCT TACCCGTGGA TTGAGAGGGG AATGGCTGAC GGAGATGGCT 
GAGCTGCACA GCGCGGGATG CGTTGCATTC GGCCAGTCGG ACAGGCCGCT TCCCAACAAC 
CGGGTGCTCA TGCAGGCAAT GCAGTATGCC TCCACCTTCG GGTTTTGCCT GTGGCTGCGT 
CCCCAGGATG TAAATCTCGC TGACGGCGGA GTTGCCCACG ATGGGGAAGT GGCAACGCGC 
CTTGGGTTGG CCCCCATTCC CGTGTGCGCC GAAACTGTCG CCCTGTCCCA CATCATCCTG 
ATGGCAAAAG AAACGGGCGC CCGGGTGCAC TTGTGCCGTA TCTCCAGCGC GGAAGGTGTG 
ACCATGACAC GCGCCGCCCG CAAGCAGGGA TTATCTATTA CCTGCGACGT TGCGGCCAAT 
CACGTCCACC TGTCTGAAAT GGATATCGGT TTCTTCGATT CCAATTGTCA TCTGGTGCCA 
CCGTTGAGAA GTCTGGGAGA CCGCGACGCC TTGCGCGCAG GACTGCTGGA TGGCACTATA 
GATGCCATAT GCTCCGACCA CGCTCCCGTG GACGAGGATG CAAAGCTGCT GCCCTTTGCC 
GAGGCCGAGG CCGGCGCAAC CGGCCTCGAA TTACTCCTGC CGCTTACACT GAAATGGGCG 
GCGGAAACGA AGCTGCCCCT GGTAGTCGCA CTATCGAAGA TCACGAGGGA ACCTGCCCGC 
ATCCTTGGGG TGGAAGCCGG CCATCTCACG CCCGGGGGCA ATGCCGATCT GTGCATTTTC 
GACCCTGATC ATTACTGGAC GATTGAAGCG CCGACACTCA AAAGCCAGGG CAAGAACACG 
CCATTCCTGG GCTGGGAACT GCAAGGCAAG GTAAAATATA CGCTGATCAA CGGAAACGTT 
GTTTACGTGG ACTAG

Protein sequence

MNIAIRNGRV IDPKNSFDRV TDIYIQSGKI ASLGAVPPGF EARREINAQG LIVCPGLVDL 
SARLREPGLE YKATLESEMG AAVAGGVTSL ACPPDTDPVL DEPGLVEMLK YRARSRNQTR 
VYPIGALTRG LRGEWLTEMA ELHSAGCVAF GQSDRPLPNN RVLMQAMQYA STFGFCLWLR 
PQDVNLADGG VAHDGEVATR LGLAPIPVCA ETVALSHIIL MAKETGARVH LCRISSAEGV 
TMTRAARKQG LSITCDVAAN HVHLSEMDIG FFDSNCHLVP PLRSLGDRDA LRAGLLDGTI 
DAICSDHAPV DEDAKLLPFA EAEAGATGLE LLLPLTLKWA AETKLPLVVA LSKITREPAR 
ILGVEAGHLT PGGNADLCIF DPDHYWTIEA PTLKSQGKNT PFLGWELQGK VKYTLINGNV 
VYVD