Gene Nmul_A0006 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0006
Symbol
ID	3786444
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	7704
End bp	8804
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	61%
IMG OID	637810074
Product	riboflavin biosynthesis protein RibD
Protein accession	YP_410707
Protein GI	82701141
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0117] Pyrimidine deaminase [COG1985] Pyrimidine reductase, riboflavin biosynthesis
TIGRFAM ID	[TIGR00227] riboflavin-specific deaminase C-terminal domain [TIGR00326] riboflavin biosynthesis protein RibD

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTCTCGC CAACCGATTA CCGCTTCATG GCCCAGGCGC TGCGGCTTGC AGAAAAAGGG 
CTTTATAGTA CAAGCCCGAA CCCCCGCGTG GGTTGTGTGC TGGTACGCGA TGGACAGGTG 
GTGGGTACGG GCTGGCACGA ACGCGCTGGC GAAGCGCATG CGGAAATAAA TGCACTGGCT 
GCCGCCGGAC CGGCAGCCCG GGGCGCCCTT GCCTATCTCA CGCTGGAGCC GTGCAGTCAC 
TATGGCCGCA CTCCACCCTG CGCCGATGCC CTGGTTCAGG CAGGTGTCGC GAAAGTCATT 
ACAGCCATGC AGGACCCGAA TCCCCTCGTG GCCGGTCGCG GCTGCGCCCT TCTGGAAGAG 
GCGGGGATAG AAGTGAAAAC CGGCTTGATG GAAGCGGAAG CGAAAGCTTT GAATATCGGA 
TTTGTCTCGC GCATGACCCG CGGTCGTCCC TGGGTCAGGG TCAAGATCGC GGCAAGTCTC 
GATGGCAAGA CGGCGCTCAA CAACGGGTCC AGTCAATGGA TCACGAGCGC GGCGGCACGC 
CGGGACGGGC ACCGCTGGCG CGCCCGTTCC TGCGCGGTAA TGACCGGCAT TGGTACGGTG 
TTGGCCGATG ACCCGCAGCT CACGGTGCGC CATATCCATA CCTCCAGGCA ACCTATGCCG 
GTAGTGGTGG ACAGGGGACT GGATATACCG CTGGATGCAG GATTGCTGCG AGGCGCAGGC 
GAACTGGTTT TTACCGCTGC TGCCAGTGAA GGCAAAATTG TCGCGTTACG GGACGTGGGG 
GCGCACGTCA TCCTGTTGCC GGATAGCGCT GGCAACGTGG ATCTGGCTGC TATGATGCGA 
CGGCTTGCGG ATCTCGAAAT AAACGAAGTG CTGGTGGAGG CGGGATCCGG CTTGAATGGA 
GGGCTTATCC AGGCGGATTT GGTGGATGAG TTCGTCATTT ATCTTGCCCC CTGTCTGATC 
GGGAATGCGG CGCGGGACAT GCTCAAATTA CCGGAACTCT CGAATCTGGA AGACAAGCGA 
GCCCTCAAGA TCCACAATGT ACGCGCCGTG GGGCAGGATA TTCGCATTAT TGCCCGTGGC 
CCTGACGGGA TGGCTACATA A

Protein sequence

MFSPTDYRFM AQALRLAEKG LYSTSPNPRV GCVLVRDGQV VGTGWHERAG EAHAEINALA 
AAGPAARGAL AYLTLEPCSH YGRTPPCADA LVQAGVAKVI TAMQDPNPLV AGRGCALLEE 
AGIEVKTGLM EAEAKALNIG FVSRMTRGRP WVRVKIAASL DGKTALNNGS SQWITSAAAR 
RDGHRWRARS CAVMTGIGTV LADDPQLTVR HIHTSRQPMP VVVDRGLDIP LDAGLLRGAG 
ELVFTAAASE GKIVALRDVG AHVILLPDSA GNVDLAAMMR RLADLEINEV LVEAGSGLNG 
GLIQADLVDE FVIYLAPCLI GNAARDMLKL PELSNLEDKR ALKIHNVRAV GQDIRIIARG 
PDGMAT