Gene Nmul_A0452 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0452
Symbol
ID	3785999
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	501630
End bp	502910
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	54%
IMG OID	637810528
Product	ribonuclease BN, putative
Protein accession	YP_411152
Protein GI	82701586
COG category	[S] Function unknown
COG ID	[COG1295] Predicted membrane protein
TIGRFAM ID	[TIGR00765] YihY family protein (not ribonuclease BN)

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGAGCTTT TCTCTCAATC CTCACGACCT GTCGCGAAAG TAATGAAATC CATACGTCCC 
GTCGATTTCA TGCACTATGT CCTTGTGCGC TTTTTCCAGC ACAACTGCAC CCAGATTGCA 
GGGAGTCTTA CATTCACCAC CTTGCTTTCG TTGGTACCAA TGCTCGCGAT CGGGTTATCG 
GTAATAGCGG CATTTCCCGC ATTCGCTGAA TTCTCGGACC GGATAAAGGA ATTCATTCTC 
ACCACCATGG TGCCGGAAGC AGCAAACAAG GTCATCTCCG TATACATGCA GCAATTCGCC 
GACAATGCGG CCAAGCTGAC TGCCATAGGC ATCGCCTTCC TGGGCGTAAC CGCACTTGCG 
CTCATGCTTA CAATAGACGA AGCACTCAAC AGCATCTGGC GAGTATCCCG CCTGCGGCCG 
CTCCTGCATC GCCTCCTGAT ATATTGGTCC GTTCTGACGA TTGGCCCTTT ATTGATCGGC 
GCGAGCCTGT CGCTTACGTC CTGGCTCATG ACCGCTTCCA GGGGATTTAC TCGTGATATC 
CCGGGGGGGG ACATCATGCT TTTGCGGTTG AGTCCGCTCG TGCTGACGAG TATTGCCTTT 
TCGGCTTCCT ATCTCATCGT GCCGAATCGT CAGGTGGCAT GGCGGCATGC GATAGCGGGT 
GGCGTGGCGG CGGCGATAGG GTTCGAGATA ATGAAGGAAG GCTTTGCGTT CTACATCACC 
CGGTTTCCGA CTTATCAGGC AGTATACGGC ACCTTTGCGA CCATTCCCAT TTTCCTGCTA 
TGGCTTTATC TTTCATGGTT GATGGTGCTG CTCGGAGCGG TTATTGCCGC ATCGCTTTCA 
AGCTGGCGTT TCCGGGAGTG GCGTGACGAC CCGAACGCCA GGGGTAAGCA GTTTTTTGAT 
GCATTGCGTT TATTGGGGAT ACTTGGAGAG GCGTTGAAGG CAGGCAAAGT TGAAACCGCT 
CTCAGCTTGC AGCAGCAGTT GATGCTAAGT CCCGAAGAAG TGGAGCGGAT ACTGGAGCTC 
ATGGTGAAAG CCAATTTCGT GCGACAGGTT CAGGAAGGAG GATGGGTTCA AATACTGGAT 
CCCGCCGAGA TCCGCATTGC GGATGTCTAC CGCCTGTTTG CGTTTCGTCC CGAAGCACTA 
AGGGGTACGG CAGGGGGGGA TACCCGGCTG GAGCAGCTGC TCGATGATAT TGCTGTGGGG 
ATCGATGAGA AAATGAGCCT TCCGCTGTCG CAACTTTTTA CTTCCGCGGA ACCGGAACCA 
CCCGCAGAAA TGTCAGCTTA G

Protein sequence

MELFSQSSRP VAKVMKSIRP VDFMHYVLVR FFQHNCTQIA GSLTFTTLLS LVPMLAIGLS 
VIAAFPAFAE FSDRIKEFIL TTMVPEAANK VISVYMQQFA DNAAKLTAIG IAFLGVTALA 
LMLTIDEALN SIWRVSRLRP LLHRLLIYWS VLTIGPLLIG ASLSLTSWLM TASRGFTRDI 
PGGDIMLLRL SPLVLTSIAF SASYLIVPNR QVAWRHAIAG GVAAAIGFEI MKEGFAFYIT 
RFPTYQAVYG TFATIPIFLL WLYLSWLMVL LGAVIAASLS SWRFREWRDD PNARGKQFFD 
ALRLLGILGE ALKAGKVETA LSLQQQLMLS PEEVERILEL MVKANFVRQV QEGGWVQILD 
PAEIRIADVY RLFAFRPEAL RGTAGGDTRL EQLLDDIAVG IDEKMSLPLS QLFTSAEPEP 
PAEMSA