Gene Amir_1039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_1039
Symbol
ID	8325211
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	-
Start bp	1152123
End bp	1153850
Gene Length	1728 bp
Protein Length	575 aa
Translation table	11
GC content	73%
IMG OID	644941583
Product	peptidase S8/S53 subtilisin kexin sedolisin
Protein accession	YP_003098841
Protein GI	256375181
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1404] Subtilisin-like serine proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGATCAC GCAGAATCGC CCACCCCGCC CTGGTGCTGG TGGGAGCCGC CGCACTCGTC 
GCCGCCGCGA CGACGCCCGC CGCCGCCGAG CAGGCCACCA CCGAGTACAC CGTGCTGGTC 
GAGGATGGGG CCAGCCGGGA CGCCGCGGTC GCGGCGGTGC GCGCTGCGGG CGGCCACCTG 
GTCCGCGAGA ACAGCGCGGT CGGGATGCTG GTCGTGCGGG CGCCGGAGTC CGGTTTCGCC 
GGGCGCGTCT CCGCCTCGCC GTCGGTGCTG GGCGCGGCCA CGGCCAAGCC GATCGGCCGC 
ACGCCCGGTT CGGTGGGCAA CCGCGAGTGG TCCGACGTGG AGAAGGAGAA CACCGCGCTG 
GGCGCGGCGA AGGCCCCCTC CGCGTCGCGC AAGGCCGCTG CCGCGCAGGC GGGCCTCGAC 
CCGCTGGACA GCGACCTGTG GGGCCTGCGC GCGGTGCGCT CCGACATCGC CCGCGCCAAG 
CAGCCCGGCG ACAAGCGGGT CAAGGTCGGC GTGATCGACA CCGGCGTCGA CGGCAACCAC 
CCGGACATCG CGCCGAACTT CGACCGCGAC CTGTCCCGCA ACTTCACCGT CGACCTGCCC 
TACGACGCGG ACGGCGGCGA GTTCGACGGC CCGTGCGAGT TCCGGGGCTG CGTCGACCCG 
GCGGACCACG ACGACGGCGG CCACGGCACG CACGTCGCGG GCACCATCGG CGCGGCGGCC 
AACGGCTCCG GCGTCTCCGG CGTCGCCCCG AACGTCACCC TGGTGAACGT GCGGGCGGGC 
CAGGACTCGG GCACGTTCTT CCTGCAGCCG GTCGTCGACG CGCTCACCTA CAGCGCGGAC 
GCGGGCCTGG ACGTGGTGAA CATGTCCTTC TACGTCGACC CGTGGTACAT GAACTGCGGC 
AACGACCCCA CGGCCACCGC CGAGGAGCAG CTGGAGCAGC GCACCACCAT CACCGCGGTG 
CAGCGCGCCC TGAACTACGC GCACGGCAAG GGCGTCACGC TGATCGGCGC GGGCGGCAAC 
AACCACGAGG ACCTCGGCAG CCCGAGGACG GACGTGGTGA GCCCGAACTA CCCGCCCGGC 
CACGCCCGGC CGCGCCCGGT GGACTCCAGC TGCCTGAACC TGCCGACCGA GGGCGACCAC 
GTCATCTCGG TGTCGGCGCT CGGCCCGTCG CTGACGAAGG CCGACTTCTC GAACTACGGC 
ACCGAGCAGA CCGAGCTGTC CGCGCCCGGC GGGTACTTCC GCGACGGCCT GGGCACCGAC 
TGGTACCGCA CGAACGAGAA CCTGGTCCTG TCGACCTACC CGCGCAACGT GGCCCTGGCC 
GACGGCGCGA TCGACGCGGA CGGCAACCTC ACCCCGGCGG GCGAGTCGGC GGGCGTGAGG 
AAGGACTGCT CGACCGGGAC CTGCGCGTAC TACCAGTTCC TGCAGGGCAC CTCGATGGCC 
GCCCCGCACG CGTCCGGCGT GGCCGCGCTG GTGGTCAGCC AGTACGGCAA GAACGACAAG 
AAGCACCCCG GCACGCTGAC CATGGCGCCG GACAAGGTGA AGACCGTGCT GACCGGGACC 
GCGACCAAGC GGCCGTGCCC GGTGCCCAGG ACGGTGTCGT ACGTGAACGT CGGCCGCTCG 
GCCGAGTTCG ACGCGACCTG CGTGGGCGAC GCGAAGTTCA ACGGCTTCTA CGGCCACGGC 
ATCGTCGACG CGTACGGCGC GGTGACCAGG GGCGGCGGGC TGATCTAG

Protein sequence

MRSRRIAHPA LVLVGAAALV AAATTPAAAE QATTEYTVLV EDGASRDAAV AAVRAAGGHL 
VRENSAVGML VVRAPESGFA GRVSASPSVL GAATAKPIGR TPGSVGNREW SDVEKENTAL 
GAAKAPSASR KAAAAQAGLD PLDSDLWGLR AVRSDIARAK QPGDKRVKVG VIDTGVDGNH 
PDIAPNFDRD LSRNFTVDLP YDADGGEFDG PCEFRGCVDP ADHDDGGHGT HVAGTIGAAA 
NGSGVSGVAP NVTLVNVRAG QDSGTFFLQP VVDALTYSAD AGLDVVNMSF YVDPWYMNCG 
NDPTATAEEQ LEQRTTITAV QRALNYAHGK GVTLIGAGGN NHEDLGSPRT DVVSPNYPPG 
HARPRPVDSS CLNLPTEGDH VISVSALGPS LTKADFSNYG TEQTELSAPG GYFRDGLGTD 
WYRTNENLVL STYPRNVALA DGAIDADGNL TPAGESAGVR KDCSTGTCAY YQFLQGTSMA 
APHASGVAAL VVSQYGKNDK KHPGTLTMAP DKVKTVLTGT ATKRPCPVPR TVSYVNVGRS 
AEFDATCVGD AKFNGFYGHG IVDAYGAVTR GGGLI