Gene Mvan_0421 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_0421
Symbol
ID	4647796
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	+
Start bp	458056
End bp	459417
Gene Length	1362 bp
Protein Length	453 aa
Translation table	11
GC content	73%
IMG OID	639803929
Product	peptidase S8/S53 subtilisin kexin sedolisin
Protein accession	YP_951275
Protein GI	120401446
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1404] Subtilisin-like serine proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.659974
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGTGCAC ACCCGTGGGC GCTGGCAGCC GCGGTCGCGC TGCTGGCGGC CAGTGCGCCG 
CCGGCCGGCG CCATCACCCC GCCCGAGGTG GACCCTGCCG TGCCCCCTCC GGGCGGCAGC 
GTGGGGCCGG TCGGGGCGAT GGCGCAACGC AATCCGTGTG TCATCAGTAC CGCGCTCCCG 
GGCACCGACC CCGGCGCCGC AACCCCGGAT CGGACTGCGC TGCGCCTGTC CGAGGCCTGG 
ACCCACAGCC GAGGTGAGGG GCAGACCGTC GCGGTACTCG ACACCGGGGT CAAGCCCGGA 
CCGCGGCTCC CCGACGTCGA GGCCGGAGGT GACTACGTCG CCTCCGGTGA CGGCCTGACC 
GACTGCGACG GGCAGGGCAC GCTCGTCGCG GGACTGATCG CCGGACAGCC CGGCGCGGAC 
GGTTTCTCCG GAGTCGCGCC CGCCGCCCGC ATCCTGTCGA TCCGGGTGTC CTCGCCGCGG 
TACGCGCCGC GGGATGCCGG CGAGGACCCG GCCGTCACGC GCGCGATGCT CGAGACGGAG 
GCGATGGCCG GCGCGATCGT GCGCGCGGCG GACCTTGGTG CCCGCGTCAT CAACATCTCC 
GCCGTGACGT GTGTGCCTGT CGGCGAGAAC TTCGACCAGA GCGGCCTCGG TGCGGCGCTG 
CGGTACGCCG CGGTCGACAG GGACGTCGTG ATCGTCGCCG CCGCGGGCGA GGGCGGCGCT 
GCCGGTGGTT GCGATTCCAA CCCGCTGTCC GACCCGGCGC TGCCGTCGGA TCCGCGGAAC 
TGGTCGGGGG TCACCGCCGT GGCGATCCCG GCGTGGTGGC AGCAGTATGT GCTGTCGGTC 
GGGTCGCTCG CTCCCGACGG CACGCCATCG TCGTTCACAA TGGCCGGGCC GTGGGTCGGC 
ATCGCCGCGC CAGGCGAGGA CATCACTTCG GTGAGCAACG ACGAGGCCGG TGGGCTCGCC 
AACGGCCTGC CCGGCGACCG GGACCGGATC GACCCGGTCC GTGGCACCGG CTATGCGACG 
GCGTACGTCT CCGGCGTTGC GGCGTTGGTG CGCAGCAGGT TTCCCGACCT GACCGCGCGG 
CAGGTGATCG AGCGTCTCAC CGGCACCGCG CAGTCGGCGG CCAGATCCCC GTCGAACCTG 
GTCGGCGCAG GACGCATCGA CCCGGTCGCG GCGCTGACCT GGAATGTGCC CGCCACCGAA 
GAGATCGGTA CCACGGCGGC CAGGCCGGTC GCCGCTCCGG CACCACCGCC GCCGAAGGAT 
CCGGTCCCGC GCGCAGTCGC GTTCGCCGGT GCAGGAGTGT TGGCGCTCGT CGTGCTCACC 
GTGTCCCTGA TGAGCACGAG AAGGAAGGAG ACGTCGTCAT GA

Protein sequence

MRAHPWALAA AVALLAASAP PAGAITPPEV DPAVPPPGGS VGPVGAMAQR NPCVISTALP 
GTDPGAATPD RTALRLSEAW THSRGEGQTV AVLDTGVKPG PRLPDVEAGG DYVASGDGLT 
DCDGQGTLVA GLIAGQPGAD GFSGVAPAAR ILSIRVSSPR YAPRDAGEDP AVTRAMLETE 
AMAGAIVRAA DLGARVINIS AVTCVPVGEN FDQSGLGAAL RYAAVDRDVV IVAAAGEGGA 
AGGCDSNPLS DPALPSDPRN WSGVTAVAIP AWWQQYVLSV GSLAPDGTPS SFTMAGPWVG 
IAAPGEDITS VSNDEAGGLA NGLPGDRDRI DPVRGTGYAT AYVSGVAALV RSRFPDLTAR 
QVIERLTGTA QSAARSPSNL VGAGRIDPVA ALTWNVPATE EIGTTAARPV AAPAPPPPKD 
PVPRAVAFAG AGVLALVVLT VSLMSTRRKE TSS