Gene Namu_5026 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_5026
Symbol
ID	8450657
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	5605607
End bp	5606887
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	73%
IMG OID	645044063
Product	peptidase S8/S53 subtilisin kexin sedolisin
Protein accession	YP_003204287
Protein GI	258655131
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1404] Subtilisin-like serine proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	55
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGAGT CGTTGGGGTC GATGATGCTC GCGGCATTGG ACGAGGCCGG CCCCGGAGCC 
GACCCGGAGT TGCCGGTCGT GCTGCAGATC GACGCACTCT CGCCGGGGGC CGACGAGTCG 
TGGGGGCACT TCAAGGATCG GGTCGGAGAC CGGCTCGGCC GGCAGACCGA CCTGCTCCGG 
GACCGGATCG GCGTGGGCGA CGTGCGCGAG CTGTACGCCG GCAACGCACT GGCCGCCTCG 
CTGACCACCG AGCAACTGGC CGCCGTCATC GACGATCCGC AGATCGCCAT CCTGTTCGCC 
GATCTCGATC CGGTGCTGCC GGTGGTGCTG ATGCACGAGG TGCACGAGCT GGTCGGCGCC 
CCCGCCTTCC GCCGTGCGGG CGGTGGGCTG ACCGGCGCCG GGGTGAGCGT CGCGGTGCTC 
GACACCGGCA TCGACCGGCG GCATCCGGCG CTGACCGTCG CGCACAGCAT CCAGACCTGC 
GACGAATCCG TCGACATCCC CGGCCACCAC GGCACGCACT GCGCCGGCAT CATCGCCTCG 
ACCGACCCGC GGGCGCCCGG CATCGCCCCC GGTGTGGACC TGATCGACGT GAAGGTGCTG 
CGGGCCAACG GAACCGGCCG GCACACCGAC ATCACCGCCG GTGTGGACCG GGCCCTGGAC 
CGCGCGGCCG ACATCCTGTC CATCAGCCTG GGGTTCAACC ACCTCCCGAT CAGCGTGCCC 
GGCGGTCACG GCTGGACCTG CGTGGACGGC GCCTGCCCGC TGTGCACGGC GGTGGACAAC 
GCGGTGCTGG AAGGCGCGCT GGTGGTGGTG GCCGCCGGCA ACGAGCATCA GCGCTGCGAA 
GGGGTGCGCT CGGCCGGGCA GGGACTGGTC TACGACACCG AGCTGAGCTG CCCCGGCCAG 
GCCCGCGGCG CCCTCACGGT CGGCGCCACG CACAAGGCCA CGCATGCGCC GGCCCGCTTC 
TCCAGCAACG GGCCGACCGC CTACGACTCG GGCAAGCCGG ATCTGGTCGC CCCCGGGGTG 
GACGTCCGGT CCACCGTGCC GCTCCCGCCG GCCAGTCCCG GCGGATCGGC GGTGGCCCCG 
CCGCCGTTCG GGATGAAGAG CGGCACCTCG GTCGCCGCCC CTGTAGTCGC CGGGGCCTGC 
GCCCTGCTCA TCGAGTCGGC CCGCCGGACC GGCGCCCCCG ACGACCCGGC CGCCATTCGT 
CGCATCCTGC TGGACACGTG TGTCGAGCGG ATCGGTGGTC CGGCCAACGT TGTCGGGGCC 
GGGCGGCTGC GGCTGCCGTG A

Protein sequence

MIESLGSMML AALDEAGPGA DPELPVVLQI DALSPGADES WGHFKDRVGD RLGRQTDLLR 
DRIGVGDVRE LYAGNALAAS LTTEQLAAVI DDPQIAILFA DLDPVLPVVL MHEVHELVGA 
PAFRRAGGGL TGAGVSVAVL DTGIDRRHPA LTVAHSIQTC DESVDIPGHH GTHCAGIIAS 
TDPRAPGIAP GVDLIDVKVL RANGTGRHTD ITAGVDRALD RAADILSISL GFNHLPISVP 
GGHGWTCVDG ACPLCTAVDN AVLEGALVVV AAGNEHQRCE GVRSAGQGLV YDTELSCPGQ 
ARGALTVGAT HKATHAPARF SSNGPTAYDS GKPDLVAPGV DVRSTVPLPP ASPGGSAVAP 
PPFGMKSGTS VAAPVVAGAC ALLIESARRT GAPDDPAAIR RILLDTCVER IGGPANVVGA 
GRLRLP