Gene Nmul_A0131 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0131
Symbol
ID	3785779
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	136565
End bp	137578
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	58%
IMG OID	637810201
Product	dihydrouridine synthase TIM-barrel protein nifR3
Protein accession	YP_410832
Protein GI	82701266
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0042] tRNA-dihydrouridine synthase
TIGRFAM ID	[TIGR00737] putative TIM-barrel protein, nifR3 family

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.1484
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATCG GTTCTCATAC TCTCAAAAAC AACCTTATCG TGGCGCCTAT GGCGGGAGTG 
ACAGATCGCC CGTTCAGGCA ATTGTGCAAA AGCATGGGCG CCGGAATGGC TGTGTCCGAA 
ATGGTGTCGA GCAATTCGCT CCTCTGGGGT TCCGAGAAGA CACGCCGCCG CGCCAATCAT 
GAAGGCGAGG TGGATCCGAT CTCGGTGCAG ATCGCCGGCG CCGACCCGGC GATGATGGCG 
GAAGCTGCGC GCTACAATGT CGCGCAAGGA GCCCAGATCA TCGACATCAA CATGGGTTGC 
CCTGCCAAGA AGATTTGTAA TGTCATGGCA GGCTCTGCAT TGCTGCAGGA CCCGCCGCTG 
GTCGGGCGGA TTCTGGATGC CGTCATAGGC GCGGTGAGGG TGCCTGTCAC CCTCAAGATT 
CGCACGGGGT GGGATACCCA GCACAAGAAT GCGCTCTCCA TTGCCCGCAT TGCGGAGAAT 
GCCGGCATCC AGGCGCTTGC TATCCATGGA CGTACGCGCG CCTGTGCTTA CACCGGCCAT 
GCCGAATACG ATACCATCGC GGCAGTCAAG GCTGAGGTGC GGATTCCCGT TGTCGCCAAT 
GGGGACATTA CAACACCGGA AAAAGCAAAA CACGTGCTTG ACTACACGGG AGCGGATGCG 
GTCATGATCG GCCGCGCAGC ACAAGGCCGC CCCTGGATTT TTCGCGAGAT CGATCACTAT 
CTGGCTACCG GCTCACACCT TCCGCTGCCT GAAGTAGCGG AGATTCACCG TGTACTCGTC 
GCACATTTGC ACGATCTATA TAGCTTCTAT GGCGAGTATT CGGGGGTCCG CATCGCCCGC 
AAGCATATTT CCTGGTATAC CAAAGGACTG GTCGGGTCAG CGGGTTTCCG TCATGCCATG 
AACCAGCTGC AGTCTACGGA CCAGCAGCTG TCTGCGGTTA ACGACTTTTT CAGTGAGCTT 
GCCGGCTACG GGCGGCGGTT GACCTACGTC GAGGCTGAGG AACTGGTGGC ATGA

Protein sequence

MKIGSHTLKN NLIVAPMAGV TDRPFRQLCK SMGAGMAVSE MVSSNSLLWG SEKTRRRANH 
EGEVDPISVQ IAGADPAMMA EAARYNVAQG AQIIDINMGC PAKKICNVMA GSALLQDPPL 
VGRILDAVIG AVRVPVTLKI RTGWDTQHKN ALSIARIAEN AGIQALAIHG RTRACAYTGH 
AEYDTIAAVK AEVRIPVVAN GDITTPEKAK HVLDYTGADA VMIGRAAQGR PWIFREIDHY 
LATGSHLPLP EVAEIHRVLV AHLHDLYSFY GEYSGVRIAR KHISWYTKGL VGSAGFRHAM 
NQLQSTDQQL SAVNDFFSEL AGYGRRLTYV EAEELVA