Gene Nmul_A1854 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1854
Symbol
ID	3786596
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	2137370
End bp	2138278
Gene Length	909 bp
Protein Length	302 aa
Translation table	11
GC content	54%
IMG OID	637811939
Product	N5-glutamine S-adenosyl-L-methionine-dependent methyltransferase
Protein accession	YP_412541
Protein GI	82702975
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG2890] Methylase of polypeptide chain release factors
TIGRFAM ID	[TIGR00536] HemK family putative methylases [TIGR03533] protein-(glutamine-N5) methyltransferase, ribosomal protein L3-specific [TIGR03534] protein-(glutamine-N5) methyltransferase, release factor-specific

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTCATTG AAGCCAAAAA CCAGCTCCAG ACCATCCGCG ACGTACTGCG TTTCGCCATA 
AGCCGCTTTA ACGATGCAGG GCTTCATTTT GGTCATGGCT CTGCCTCGGC GTATGACGAA 
GCAGCTTATC TCATTCTCCA CACGCTGCAT CTTCCACTTG ACCGGCTGGA ACCGTTTCTG 
GATGCCCGCA TCCTTCCGGG CGAGCTGGAA CTGGTCCTGA AAATAATCGA GCGCCGTGCA 
ACAGAAAAGA TTCCGGCTGC CTATCTGACG AGAGAAGCCT GGCTGGGGGA TTTCCATTTT 
TATGTGGATG AACGCGTGAT CGTACCGCGC TCCTTCATTG CGGAATTGCT GCGAGAACAA 
CTTGCGCCCT GGATGGAAGA GCCGGCAGAA GTTTATTCCG CATTGGATCT TTGCACCGGC 
TCCGGATGTC TGGCGATACT GCTCGCACAT GCGTTTCCCA ATGCAGCCAT CGATGCGACA 
GATATTTCAG CGAATGCCTT GCAGGTTGCT GAAAAAAATG TGGAGGAGTA TGGCCTGGAG 
GACCGGATCG ATCTTATCCA GTCGGATCTA TTCGCGGCAT TGGCAGACCG CCGCTACGAT 
CTTATTGTCA GCAATCCGCC CTATGTCAAC GCGGAAGCAA TGGCAGCGTT GCCGGAGGAA 
TATCGCCATG AGCCGCAGAG TGCGCTTGCC AGCGGCGAGG ATGGACTGAA GGCGACAAAG 
GTAATACTAC GGGACGCAGC AAACCATTTG ACCGCTGATG GGTTACTCAT TGTCGAAATC 
GGTCATAACA GGGAAGCCCT GGAGCGTGCC TTTCCCGATA CACCTTTTAC CTGGCTGGAC 
ACCAGTGCAG GCGATGAGTT TGTTTTCCTG CTGAAACGGG ACCAGCTTCC CAGGCATCAG 
GCTTTGTAA

Protein sequence

MFIEAKNQLQ TIRDVLRFAI SRFNDAGLHF GHGSASAYDE AAYLILHTLH LPLDRLEPFL 
DARILPGELE LVLKIIERRA TEKIPAAYLT REAWLGDFHF YVDERVIVPR SFIAELLREQ 
LAPWMEEPAE VYSALDLCTG SGCLAILLAH AFPNAAIDAT DISANALQVA EKNVEEYGLE 
DRIDLIQSDL FAALADRRYD LIVSNPPYVN AEAMAALPEE YRHEPQSALA SGEDGLKATK 
VILRDAANHL TADGLLIVEI GHNREALERA FPDTPFTWLD TSAGDEFVFL LKRDQLPRHQ 
AL