Gene Namu_3304 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3304
Symbol
ID	8448919
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	3632207
End bp	3633526
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	71%
IMG OID	645042382
Product	peptidase S8/S53 subtilisin kexin sedolisin
Protein accession	YP_003202622
Protein GI	258653466
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1404] Subtilisin-like serine proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.1007
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.0511831
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAATTCA GCATTCCGGC CCTGCCCGAC CCTGATCCCA GCACGGTCCC GCTGGGCGGC 
ACCCCGGTAC AGACCACCGG CCGCTTCATC GTTGTGTTCG CCCGAGGCAC CGACGCCAAG 
GCGACCCTGG CCCGGACCGC CGGCGTCGGC ACCGTGGCCG ATTCGCGCGA CTTCACCGCC 
CAGGCCGTCG ATTTCAGTCA GACCGAGGGG TCGGACGCGG TCTGGTTCGA CACCCTGGGC 
GTCGCCGTCG TCACGGCCGA ACCGGCTCAA CTCGGGGCGC TGCGGACCGC CGAGGCCGGT 
GAGGACGCGA TCATCTCGGT CTCGCCGGAG CTGATTCACC ACATCCTGGA CGGCGACTAC 
CTGCAGGGTT ACCGGGACGG GGTCAGTGAC CTGGCCGGGC GGCTCGGCGC GGTCGAGCGG 
CCGGCAGGCT CCGGAGTGTC CGCGGCCGCC GCCAATCCCT CGTTCGCCGA CAACGCCCAA 
TTCACCTGGG GCCTGCAGGC GACCGGAGTG TCGACCTCAC CCCAGTCCGG CGCCGGCATC 
AAGGTCGCCG TCCTGGACAC CGGGTTCGAC GTGGGCCATC CCGACTTCGT CGGCCGTTCG 
GTGACCACCC AGTCCTTCGT TGCCGGGGAG ACCGTCCAGG ACGGGCACGG CCACGGCACC 
CACTGCATCG GTACCTCCTG CGGGTCGAAG GCGCCGGAGA CCGGACCGAG GTACGGCGTC 
GCCTACGGCG CGTCGATCTA CGCCGGAAAG GTGCTGGGCG ACAGCGGCTC CGGCTCCGAC 
GGGGGCATCA TCGCCGGCAT CAACTGGGCC GTGGAGAACG GCTGCCACGT GATCTCCATG 
TCCCTGGGGG CGGACGTGGC CTCGGTGCAC CCGCCCTACA CGGTGGTGGG CCAGCGCGCT 
CTGGACGCCG GTTCGCTGAT CGTCGCTGCG GCCGGCAACA ACGCCGACCG CCGGGTCGGC 
AACTTCGGCT TCGTGGGCAC CCCGGCCAAC AGCCCGTTCA TCATGGCCGT CGGCGCCCTG 
GACCAGAAGC TGGACATGGC CTACTTCTCG GCCCGCACCC TGGCCGGCAC CCGCGGCGGG 
CAGGTCGACA TCGCTGGGCC CGGCTACCAG GTCTACTCGT CGTGGCTGAT GCCGACCCGG 
TACAAGACGA TCAGTGGCAC CAGCATGGCC ACTCCGCACG TGGCCGGCGT CGCCGCGCTC 
TGGGCCGAGC TCACCGGCTA CCGCGGCCGC GATCTGTGGG CCACCCTGGC CCAGGACTCG 
CAGCGCCTGC TGCAGCCGTC GGTGGACGTC GGCGGCGGAT TGGTCCTCGC CCCGCAATGA

Protein sequence

MEFSIPALPD PDPSTVPLGG TPVQTTGRFI VVFARGTDAK ATLARTAGVG TVADSRDFTA 
QAVDFSQTEG SDAVWFDTLG VAVVTAEPAQ LGALRTAEAG EDAIISVSPE LIHHILDGDY 
LQGYRDGVSD LAGRLGAVER PAGSGVSAAA ANPSFADNAQ FTWGLQATGV STSPQSGAGI 
KVAVLDTGFD VGHPDFVGRS VTTQSFVAGE TVQDGHGHGT HCIGTSCGSK APETGPRYGV 
AYGASIYAGK VLGDSGSGSD GGIIAGINWA VENGCHVISM SLGADVASVH PPYTVVGQRA 
LDAGSLIVAA AGNNADRRVG NFGFVGTPAN SPFIMAVGAL DQKLDMAYFS ARTLAGTRGG 
QVDIAGPGYQ VYSSWLMPTR YKTISGTSMA TPHVAGVAAL WAELTGYRGR DLWATLAQDS 
QRLLQPSVDV GGGLVLAPQ