Gene Nmul_A2158 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A2158
Symbol
ID	3784398
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	2452427
End bp	2453488
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	58%
IMG OID	637812246
Product	RNA 3'-terminal-phosphate cyclase
Protein accession	YP_412843
Protein GI	82703277
COG category	[A] RNA processing and modification
COG ID	[COG0430] RNA 3'-terminal phosphate cyclase
TIGRFAM ID	[TIGR03399] RNA 3'-phosphate cyclase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.164943
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGGAAA TCGATGGTTC TTATGGAGAA GGTGGCGGCC AGTTGCTCCG CACGTCGGTT 
GCGCTTGCGG CGATAACGGG ACAATCGGTT CGTGTGTACA ACATTCGTGC AAAACGTTCC 
AATCCTGGTC TTGCGCCTCA ACATCTGACT GCCGTAAAGG CGGTGGCAGC GCTTTGCAGG 
GCCCGGACGG AAGGAATGGA AGTCAAATCG CAGGAAATCA TTTTTCGCCC TGGCCCGTTA 
CGCGGGGGCG AATATGATTT TCCGATAGGC ACGGCAGGCA GTGTTACCTT GGTGCTCCAG 
GCAGCGCTTC CAGTTGCCTT GGCATGCGGA GAAAAGGTGC GGATGAACAT TTCGGGTGGG 
ACCGATGTTC GCGCTGCGCC GCCCCTGGAT TACTTCCGCT ACGTATTGCT GCCGCTGGTT 
TATAGCATGG GCGCCAGGGC GAAGATCGAA GTGTTGCTCC GGGGGTATTA TCCTCGCGGC 
GGAGGAAAGG TGGTTGTGGA CGTAGAACCT TGCCTGCCTT TGCGTCCGGT GCTCCTGAAC 
GCATCGGAAG GGCTGGAGGG TATAACCGGT TTCGTACACA TTTCAAACCT GCCCAAGCAC 
ATCATCCACC GCATGGCGAA CGGAGCACTG GCGGAACTTT CGACTTTTCC CACCCCAGCT 
GTTGGCCTGG AAGTATTCGG GAAGGATGAC GCGATAGGTG AGGGCGGAGC GGTGCTTTTG 
ACCGCGCACA AGGAGCATAG CCGTCTGGGG GCATCTGCCG TCGCAGAAAG AGGCGTGCCA 
GCCGAACGCC TCGGTGCTGA GGCGGGGCGG TGCTTGCGCG AGGAAATCCT GTCCGGCGCA 
ACGCTGGATA TTCATGCGGC AGACCAAGTA TTGATCTACC TCGCGCTGGC GAGCGGCGTA 
TCTTGCTTTC TCACAAGGGA ACTCTCCTCC CACGCCGCGA CAACCATTTG GCTGCTGGAA 
CAGTTTCTGC CAGTCCGCTT CCAGGTCACA CAGGAGGCGC ATTTGATTCG CGTCCGCGCA 
AAGCCGGAAT TTAATGGTAT GTCAAGCTTT TTGTGGCGAT AA

Protein sequence

MQEIDGSYGE GGGQLLRTSV ALAAITGQSV RVYNIRAKRS NPGLAPQHLT AVKAVAALCR 
ARTEGMEVKS QEIIFRPGPL RGGEYDFPIG TAGSVTLVLQ AALPVALACG EKVRMNISGG 
TDVRAAPPLD YFRYVLLPLV YSMGARAKIE VLLRGYYPRG GGKVVVDVEP CLPLRPVLLN 
ASEGLEGITG FVHISNLPKH IIHRMANGAL AELSTFPTPA VGLEVFGKDD AIGEGGAVLL 
TAHKEHSRLG ASAVAERGVP AERLGAEAGR CLREEILSGA TLDIHAADQV LIYLALASGV 
SCFLTRELSS HAATTIWLLE QFLPVRFQVT QEAHLIRVRA KPEFNGMSSF LWR