Gene Namu_4133 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4133
Symbol
ID	8449759
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	4568653
End bp	4569786
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	75%
IMG OID	645043182
Product	type I phosphodiesterase/nucleotide pyrophosphatase
Protein accession	YP_003203411
Protein GI	258654255
COG category	[R] General function prediction only
COG ID	[COG1524] Uncharacterized proteins of the AP superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.0770784
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.0000385329
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGACCGCCG ACTGGCTGGT ACCCGGCTAC GACCAGCGCG CGCTGGGGGC CCTGCTACCC 
GGTGCGGCCG CCGCGCTCGG CCACGACCTG GGCCGGCCCG CCGTGTCGCT GCCGGCGGCC 
GAACGGATCT GCGTGGTCGT CGTCGACGGG CTCGGTCACC GGATGCTGCT CGAACGCCCG 
CGGGCCGCCC CCTTCCTGAG CACGCTGATG GACCCCGAGC AATGCCTGGT GGCCGGCGCG 
CCCAGCACCA CCGCCACCTC GATGGCCTCC TTCGGCACCG GCCTGCCGCC CGGCCGGCAC 
GGGCTGGTCG GGTACGAGGT GATGGACCCG GACCGCGGCG AGCTGCTCAA CGAGCTGCGC 
TGGCATCCGG ACACCGATCC GCTGCGCTGG CAGCCGCACC CGACGGTGTT CCAGGAGCTG 
GCCGCTCGCG GCGTCCCGGT CACCCAGATC GGCAACCCGG AGTTCTACGG GTCGGGGCTG 
ACCGAGGCGG CCCTGCGCGG GGCGACGTTC GTCGGGCTCA CCCGGCTGCG CGACCGGGTC 
GACGCCGCGG TCGACCGGTT GCGCGAACCG GGCCTGGTCT ACCTCTACTG GGCCGACGTG 
GATTCGGTGG GCCACGTGCA CGGCTGGCGG TCCGCGCAGT GGCGCCGCAC GGTCCGGGCG 
CTGGACCGGG AGCTGGCCCG GCTGTCCCGG TGCCTGCCGT CGGGCACGCT GCTGGTGATC 
ACCGCCGACC ACGGCATGGT CGACGTCCCG CATGCCGAGC GGCTCGACCT GGCCGCCCAG 
CCCGGCCTGT GGTCCCGGTT CCGGGTGCTG GGCGGCGAGG GCCGCTTCGC CCAGCTCTAC 
TGCGAACCCG GCACCCCGGC CGATCGGGTG GCGGACCTGG CCCGGCAGCT GGCCGACTGG 
ATCGGCGAGC GAGCCCATGT CTGCACCCGG GTCGCGGCGA TCGACGCCGG CTGGTTCGGC 
CCGGTCGAGG AACGGGTCCG GCCGCGGCTG GGCGAGGTCA TCGTGGCCGG CCGGGAGCCG 
TTCACCCTGA TCGATTCGCG CACGGCCCGG CCGCACACGC TGTCGCTGAT CGGGCAGCAC 
GGCTCGCTGA CCCCCGACGA GCAACTGGTG CCTTTCCTGC GATCCGTCAG CTGA

Protein sequence

MTADWLVPGY DQRALGALLP GAAAALGHDL GRPAVSLPAA ERICVVVVDG LGHRMLLERP 
RAAPFLSTLM DPEQCLVAGA PSTTATSMAS FGTGLPPGRH GLVGYEVMDP DRGELLNELR 
WHPDTDPLRW QPHPTVFQEL AARGVPVTQI GNPEFYGSGL TEAALRGATF VGLTRLRDRV 
DAAVDRLREP GLVYLYWADV DSVGHVHGWR SAQWRRTVRA LDRELARLSR CLPSGTLLVI 
TADHGMVDVP HAERLDLAAQ PGLWSRFRVL GGEGRFAQLY CEPGTPADRV ADLARQLADW 
IGERAHVCTR VAAIDAGWFG PVEERVRPRL GEVIVAGREP FTLIDSRTAR PHTLSLIGQH 
GSLTPDEQLV PFLRSVS