Gene Namu_4916 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4916
Symbol
ID	8450547
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	5489097
End bp	5490035
Gene Length	939 bp
Protein Length	312 aa
Translation table	11
GC content	74%
IMG OID	645043955
Product	proline iminopeptidase
Protein accession	YP_003204179
Protein GI	258655023
COG category	[R] General function prediction only
COG ID	[COG0596] Predicted hydrolases or acyltransferases (alpha/beta hydrolase superfamily)
TIGRFAM ID	[TIGR01249] proline iminopeptidase, Neisseria-type subfamily

Plasmid Coverage information

Num covering plasmid clones	64
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCACGC CGATCGAGCC GTACGCGACC GGTCTGCTGC CGGCCGCGCA CGGTGCGCAG 
CTGTACTGGG AGTGCTCGGG GAACCCGCGT GGCCGGCCGG CCCTGTTCCT GCACGGCGGC 
CCGGGCGCGC CGATGTCCGG CGGATACCGG CGGCGGTTCG ACCCGGACCG CTGGCGTGTG 
GTGTACCTGG ACCAGCGCGG ATGCGGACGT AGCCGGCCGC TGGCCCACCA GGACCTGGCC 
TCGCTGGCCG GCAACACCAC CGACCAACTG ATCCAGGACA TCGAAACGTT GCGGGTCCAC 
CTGGGCATCG ACCGCTGGCT GGTGGTCGGC GGGTCGTGGG GCGTCACCCT GGCCCTGGCC 
TACGCGCAGC GGCACCCCGA CCGGGTGTCC GGGCTGGTCC TGGCCGCGGT CACCACGGGC 
GGCCGGGAGT ACCTGGAATG GATCACCGAG TCGATGCGGC ACGTGTTCCC GCGGGAGTGG 
GACGAGTTCG CCGCCGCATC CGGGCGACGG CCCGGCCAGC GGGTCCTGGA CGCCTACCGG 
GAGCGGATCA CCGACCCCGA CCCGGAGGTG CGGGCGGCCG CGGCGGCGGC CTGGTGCGCC 
TGGGAGGACG TGCACGTTTC GCTGGCCCCG GACTGGGCCC CGTCCGCGGC GTTCGCCGAC 
CCGCAGTTCC GCGCCCAGTT CGCCACCCTG GTCATCCACT ACTGGGCCAA CGACTGCTTC 
CTGCCCCCGG ACGGCGTGCT CGGCGCGATG GCCACGATCA CCGACCTGCC CGGCGTGCTG 
ATCCACGGCC GGTACGACGT CAGCGGCCCG CTGTCGGCGG CCTGGGAACT GCACCGGCGC 
TGGCCGGCCA GCCGCCTGGT GGTGCTGGCC GACAGCGGGC ACAGCGGGGC GTCGATGACC 
GACGAGCTGA CCGCCGCCAT CGCCGGGTTC GACCCGTGA

Protein sequence

MSTPIEPYAT GLLPAAHGAQ LYWECSGNPR GRPALFLHGG PGAPMSGGYR RRFDPDRWRV 
VYLDQRGCGR SRPLAHQDLA SLAGNTTDQL IQDIETLRVH LGIDRWLVVG GSWGVTLALA 
YAQRHPDRVS GLVLAAVTTG GREYLEWITE SMRHVFPREW DEFAAASGRR PGQRVLDAYR 
ERITDPDPEV RAAAAAAWCA WEDVHVSLAP DWAPSAAFAD PQFRAQFATL VIHYWANDCF 
LPPDGVLGAM ATITDLPGVL IHGRYDVSGP LSAAWELHRR WPASRLVVLA DSGHSGASMT 
DELTAAIAGF DP