Gene Nmul_A1979 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1979
Symbol
ID	3785003
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	2275847
End bp	2277193
Gene Length	1347 bp
Protein Length	448 aa
Translation table	11
GC content	55%
IMG OID	637812068
Product	hypothetical protein
Protein accession	YP_412666
Protein GI	82703100
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0621] 2-methylthioadenine synthetase
TIGRFAM ID	[TIGR00089] RNA modification enzyme, MiaB family [TIGR01125] MiaB-like tRNA modifying enzyme YliG, TIGR01125

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCATCTC TGAAACAGCA GACTCCCCGT ATCGGCTTTG TCTCCCTCGG TTGCCCGAAG 
GCCTTGGTAG ATTCCGAGCA GATCCTTACC CAGCTTCGTG CCGAAGGTTA TGAAACTTCC 
TCTACCTATG AGGATGCGGA CCTTGTAGTC GTCAATACCT GCGGTTTTAT CGATAGCGCA 
GTGGAAGAGT CACTCGACGC TATCGGCGAG GCGCTGGCGG AAAACGGCAA GGTGATCGTC 
ACCGGTTGCC TTGGAGCAAA AGAAGGCGGG GACGTGGTCA AGCAAGCCCA TCCACAAGTA 
CTGGCGGTGA CAGGACCCCA CGCCCTGCCC GAAGTAATGG CTGCGGTCCA CATGCATCTG 
CCCCAGCCGC ACGATCCCTA TACCAGTCTC ATTCCTCCAC AAGGCATAAA GCTGACGCCC 
CGGCATTACG CTTATCTCAA GATCTCCGAA GGTTGCAATC ACCGCTGTAC CTTCTGCATC 
ATCCCTTCGA TGCGCGGCGA CCTCGTCAGT CGCCCCATCC ATCAGGTGAT GGAGGAAGCG 
GAAAACCTGG TGAACGCAGG GGTCAGGGAA TTGCTCGTCA TTTCGCAGGA TACGAGCGCT 
TATGGGGTAG ACGTCAAATA CCGCACCGGT TTCTGGCAAG GCAGGCCGCT GAAAACGCGG 
ATGACCGACT TGGCGCGCTC GCTCGGCGAA TTGGGAGTAT GGGTTCGCCT CCATTATGTT 
TACCCTTACC CGCATGTCGA TGAAGTGATT CCGCTCATGG CCGAGGGGAA AATTCTTCCA 
TATCTCGATG TACCGTTTCA GCACGCTAGT CCCCGTATCT TGAAGGCAAT GAAACGTCCG 
GCCAACTCCG AAAACAATCT TTCCCGCATT CGGCGATGGC GTGAAGTCTG TCCGGATATC 
ACCCTGCGCA GTACCTTCAT TGTCGGCTTT CCCGGAGAAA CAGAGGCGGA ATTCGAACAA 
CTCCTGGAGT TTCTCGAGGA AGCGCAACTC GATCGTGTTG GCTGCTTTGC CTATTCACCT 
GTCGAGGGTG CGGCGGCGAA CGCTCTTCCC GATCCCGTGC CGGAAGAGGT GAAAGAAGAG 
CGACGGGCGT GTTTCATGGC AATACAGGAA AAAATCAGTG CTGAACGCCT GGCCCGCAAA 
ATCGGCAAAC GCATGATTGT CCTGATAGAC GACGTAAGCA AAAACAAGGC TGTCGCCCGT 
AGTACTGCCG ACGCTCCGGA AATCGATGGC CTGGTTTATA TCGGCAAGGC AAAAAACGTA 
AAACCGGGTG AATTTATTGA AGTTGAAATT ATCCGCTCCG ACCCCCACGA TCTGCACGCT 
CGACAGGTCA GCGACAACCG AACGTAA

Protein sequence

MASLKQQTPR IGFVSLGCPK ALVDSEQILT QLRAEGYETS STYEDADLVV VNTCGFIDSA 
VEESLDAIGE ALAENGKVIV TGCLGAKEGG DVVKQAHPQV LAVTGPHALP EVMAAVHMHL 
PQPHDPYTSL IPPQGIKLTP RHYAYLKISE GCNHRCTFCI IPSMRGDLVS RPIHQVMEEA 
ENLVNAGVRE LLVISQDTSA YGVDVKYRTG FWQGRPLKTR MTDLARSLGE LGVWVRLHYV 
YPYPHVDEVI PLMAEGKILP YLDVPFQHAS PRILKAMKRP ANSENNLSRI RRWREVCPDI 
TLRSTFIVGF PGETEAEFEQ LLEFLEEAQL DRVGCFAYSP VEGAAANALP DPVPEEVKEE 
RRACFMAIQE KISAERLARK IGKRMIVLID DVSKNKAVAR STADAPEIDG LVYIGKAKNV 
KPGEFIEVEI IRSDPHDLHA RQVSDNRT