Gene Nmul_A0120 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0120
Symbol
ID	3785768
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	126615
End bp	127904
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	45%
IMG OID	637810190
Product	ATP-dependent OLD family endonuclease
Protein accession	YP_410821
Protein GI	82701255
COG category	[L] Replication, recombination and repair
COG ID	[COG3593] Predicted ATP-dependent endonuclease of the OLD family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTAAAA AAATCGTACT ACATGGTTGG CGTCAGTTCC GGAACGTTGA CATCGATTTC 
CACCCACGTC TGACAGTGCT GACTGGAGCT AATGGAGCAG GTAAGACCAC GTTATTAAAT 
TTGGTTAGTA GGCACTTCGG TTGGGACGGG TCATTTATAA GCACACCAGT ACCACGTCGG 
TCGAACCCGA GTCTCATGTA TTCGACAGAT TTTTGGGATA TAGACGATAT CCAAGTTGAC 
ATTATCCATT CCTTTGAAAG AGAGCAGAAT CGGAAAAAGC AAGCTGCTGC GCAAGGATCG 
CAAACAACAA TTGGGAAAAT TATTTACGGA GATGGAACTG AGACACTAAT AACAGTACCA 
AATAGCGAAG TCGGATCAAG ATACGATGTA AGTATTCCGG CACGACAACG CATCGATGGC 
CTGCATATTC CTTCACACCG CGCACCGTCC ACTTATCAGC AGGTTCAAAA TATTCCGACG 
ATTCCTCGCA GAAGACAGGA GGTATTTAAC CAATATCTTA GTCTTGTCCA GAGTAGATAC 
CTTGGAAGCT ACACTCAATG GTCTCCACAG TATTACATGA AGGAAACGCT AATCAGTCTA 
GCTACTTTTG GATATGGCAA TGCAGTTGTA GATGCAGACC CAGAGTCTGC TAGGCTCTTT 
GAGGGGTTTC AGGAAATTCT TCGAAAAATG CTTCCTCCAA AACTCAGGTT TAAACGCTTA 
CAAATTCGTG TTCCGGAGGT TATTCTAGAA ACAGAAACGG GAAACTTCTC TATCGATGCT 
CTCTCCGGAG GGGCTGCAGC AGTAATAGAT TTAGCGTGGC AAGTATTTAT GTATGAGCCA 
TCAGAAAGTG AGTTTGTGGT AACACTGGAT GAGCCTGAGA ATCATCTGCA TCCCGAACTG 
CAGCAGAGAG TTTTGGCAGA TCTCCTGACA GCTTTCCCGT CCGTACAATT CGTAGTCGCT 
ACCCACAGTC CATTCATTGT TGGATCTGTA CCCCATTCTC ATGTTTATGT ACTCGGATAT 
GACGACAGTC GCCGCGTAAA TAGCACTCTG CTAGATACAG TAAACAAAAC TGGGACGGCC 
AACGAAATAC TGAGAGACGT GCTTGGACTT GAGTTTACGA TTCCAGTCTG GGTCGAAAAC 
AGGTTGGAGA ATTTGATTGA AAAATATTCG AAAAAGGATT TCACGGAAGA CAACCTAATG 
ATGCTTCGTC AAGAAATGAC TTCGCTTGGT TTGGGCAAGC ACGTACCTCA AACGATTTCA 
ATGCTGGCAC AGAAGAAGGA TGGGCAATGA

Protein sequence

MFKKIVLHGW RQFRNVDIDF HPRLTVLTGA NGAGKTTLLN LVSRHFGWDG SFISTPVPRR 
SNPSLMYSTD FWDIDDIQVD IIHSFEREQN RKKQAAAQGS QTTIGKIIYG DGTETLITVP 
NSEVGSRYDV SIPARQRIDG LHIPSHRAPS TYQQVQNIPT IPRRRQEVFN QYLSLVQSRY 
LGSYTQWSPQ YYMKETLISL ATFGYGNAVV DADPESARLF EGFQEILRKM LPPKLRFKRL 
QIRVPEVILE TETGNFSIDA LSGGAAAVID LAWQVFMYEP SESEFVVTLD EPENHLHPEL 
QQRVLADLLT AFPSVQFVVA THSPFIVGSV PHSHVYVLGY DDSRRVNSTL LDTVNKTGTA 
NEILRDVLGL EFTIPVWVEN RLENLIEKYS KKDFTEDNLM MLRQEMTSLG LGKHVPQTIS 
MLAQKKDGQ