Gene Namu_5096 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_5096
Symbol
ID	8450727
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	5681773
End bp	5683101
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	73%
IMG OID	645044131
Product	HNH nuclease
Protein accession	YP_003204355
Protein GI	258655199
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTACGAT TGACCATGGC CGGGACCGCG GTAACCACCC TCGACGACGT GCACCACGTC 
GCCGAGCAGG TCCAGACCGG CCTGACCCAA CTTCTGACCG CCGAGTACTG GAAACTGCCC 
GGCCCGGACC TGCTGGACGC TGCCCGCACC GTTGAGCGCC TGGCCCACCT GACCTACGCC 
ATCCAGGTCA CCCTGGCCGG CGAAGCCGAC CTGGCCCACC TCGCCCAGAG CCACGGCCAA 
CCCAGCACCG CCGCACTGCT GCGGCACGCC CTGACCATCA GCCCCGGCGA TGCCCGCGGC 
CGGGTCCGCG CCGCCCAAGC CGTCCTCCCC CAGGACGCCA TCAGCGGCGG CGAAATCCCA 
CCCCGACACC CCGAACTCGG CGCCGCCCTG CGCGCCGGCA CCGTGGGCCG CGAACACACC 
AGCATCGTGC TCACCACCCT GAGCCGCCTG CCCAGCACCG TGCCTGCCGA CCTCCGCGAG 
CAAGCCGAAA CCACCCTGGT CGAGCACGCC ACCCACATGG ACCCGATCCA CCTGAACCGG 
GTCGCCGACC GACTCCTGGA CGCCCTGGAC CCCGACGGCC ACTTCGAACC ACCCGACCCC 
GCCGACCGCG CCGAACTCAC CCTCGGCCCC CGCGATCGGC GCACCGGCCT GACCAGCATC 
AAAGGCCGCC TGGACGACCA CACCATCGCC GCGTTCATCG CCGCCACCGA CCCCCACGCC 
GCGCCCCGCC CGCACACCGA CGGCACCAAA GACCCCCGCC CCGCACCCAC CCGCCTGGCC 
CACGCCCTGA CCACCGTCCT GGACCAACAC CTGGCCACCG GCGCCGGACC CGTCCACGCC 
GGCGAACGCC CCCACATCAC CATGACCGTG CACTACGACG CCCTCACCAA CCGCCTGGGC 
ACCGCCACCC TGGACGCCAC CGGCACCACC ATCAGCCCCG CCCACGCCCG CCAACTCCTG 
TGCGACGCCG CCCTGATCCC CGCCGTCCTG GGCGCCGCCG GCGAACCCCT GGACATCGGC 
CGCGCCACCC GCACCTGGCC CACCGCCATC CGCCGCGCCA TCACCCTGCG CGACCAAGGC 
TGCGTCTTCC CCGGCTGCGA CCGCCCCGCC CGCTGGTCCG ATCTGCACCA CATCCACCAC 
TGGGCCGACG GCGGAGCGAC CAGCACCAGC AACGGCGCCG TGCTCTGCGG ACACCACCAC 
ACCCTCATCC ACACCGGCCA CTGGCACATC CGCATGGCCC CCGACGGCCA CCCCGAGATC 
ATCCCGCCCA CCTGGATCGA CCCCCACCAA CAACCCCGCC GCAACACTCT GCACCGAATC 
CGCCAATAA

Protein sequence

MVRLTMAGTA VTTLDDVHHV AEQVQTGLTQ LLTAEYWKLP GPDLLDAART VERLAHLTYA 
IQVTLAGEAD LAHLAQSHGQ PSTAALLRHA LTISPGDARG RVRAAQAVLP QDAISGGEIP 
PRHPELGAAL RAGTVGREHT SIVLTTLSRL PSTVPADLRE QAETTLVEHA THMDPIHLNR 
VADRLLDALD PDGHFEPPDP ADRAELTLGP RDRRTGLTSI KGRLDDHTIA AFIAATDPHA 
APRPHTDGTK DPRPAPTRLA HALTTVLDQH LATGAGPVHA GERPHITMTV HYDALTNRLG 
TATLDATGTT ISPAHARQLL CDAALIPAVL GAAGEPLDIG RATRTWPTAI RRAITLRDQG 
CVFPGCDRPA RWSDLHHIHH WADGGATSTS NGAVLCGHHH TLIHTGHWHI RMAPDGHPEI 
IPPTWIDPHQ QPRRNTLHRI RQ