Gene Slin_5989 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_5989
Symbol
ID	8729770
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	+
Start bp	7258324
End bp	7259931
Gene Length	1608 bp
Protein Length	535 aa
Translation table	11
GC content	50%
IMG OID
Product	peptidase S8/S53 subtilisin kexin sedolisin
Protein accession	YP_003390750
Protein GI	284040820
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.852027
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAAAC TCCTTATCAG CGCATCCGTT TGTCTGCTTT CTATGGCAGC ATCGGCGCAG 
GAAACGCAGT GGTATCTGCG TGATAAAACC GATAATACAG CCGGTATCAG TGTTGAACGC 
ACGTACCGTG AACTTCTTAA GGATCGTAAA CCTACACCCG TCATCGTTGC CGTCATTGAC 
GGTGGAATTG ATACTACCCA TGAAGATTTG CGTCGGGTAC TCTGGGTAAA TCCTAAGGAA 
ATAGCCGGAA ATGGGAAAGA CGATGATAAA AACGGCTATG TCGATGATGT GCATGGCTGG 
AACTTTATCG GTGGGAAAGA CGGCCGAAAT GTCGATTTTG AAACCGCCGA GGTTACCCGT 
CTTTACGCAC AGCTGAAACC AAAATACGAG GGTAAAGACC GCAAAGCGTT AAAGCCGGAT 
CAGCAGAAAG AGTACGATCT GTACGTAAAG ACCAAAGCTG AGGTCGAGAA AAATCAGACT 
AAGTACAAAA CGGAATATCA GGGAATCAGC CAGTTTTACA AGCAGTATTC GGAGGCTGTG 
ACTACCCTTA AGAAAGCCCT CAACGTATCT AAACTGGATA CGACTACCCT GAGTAAGGCG 
GCTGATACCT TAACCGACGC TGCGCTGAAA CGTCCCGTTA TGGGCATACT TCGGTTACTG 
CGCCAGCAGA ACGCACCGAA CACCGACGTG GTGATGGGTG AGCTGGAAAA ATACAATGAT 
CAGCTCAAGT CGCGCGCCGA GTACAACTAC AATCCTGAAT TCAACAGCCG CACTATTGTA 
GGCGATAATC CGGACGATAT GACTCAGCGG GATTACGGTA ACCCCGACAT TGCCGGGCCA 
CGTCCTGACC ACGGTACGCA CGTAGCCGGT ATTATAGGTG CTGACCGTAC CAACAATCTG 
GGTATTATGG GAATTGCCGA TGCGGTTCAG ATAATGGGCG TTCGGGCTGT GCCCGACGGC 
GATGAGCGCG ATAAGGACGT AGCCAATGCT ATCCGGTATG CCGTCGATAA CGGAGCGAAA 
ATCATCAACA TGAGCTTTGG CAAAGATTAT TCGCCCCAGC GCAAAACTGT TGAAGATGCC 
GAACGCTATG CGTTATCGAA AGGGGTATTA ATGATTCATG CGGCTGGTAA CGACGGAAAA 
GATATCGATA CCGCAGCCAA TTACCCTGCT CCCCGGTTTA TGGATGGGTC GGCCATTCCG 
AACGTGATTA CGGTGGGTGC CAGCGCCGAG CCGAACACCG CCGATCTGGT GGCCAGTTTC 
TCAAACTATG GCAAGCAGAA TGTTGATGTG TTCGCTCCGG GCAAAGATAT TTATTCGACT 
GTGCCGGGTA GTAAGTACGA AAACAACAGC GGAACCAGCA TGGCCTCGCC CGTAGTGGCT 
GGCGTGGCGG CTGTCCTGAA ATCGTACTTC CCGAAACTGA CTTACGCCGA TATTAAACGG 
ATTATTCTGG AATCGGCAAC GCCTTACAAA ACCAAAGTAA CAAAACCCGA ATCGACGGAT 
ACCGTTGACT TCTCGTCATT ATCGAAAACG GGTGGCGTTG TTAACCTGTA TGATGCTGTG 
AAGTTAGCCC TGGCGCAGGA TGCGGCTTCT TCAGGCAAAG GAAAATAA

Protein sequence

MKKLLISASV CLLSMAASAQ ETQWYLRDKT DNTAGISVER TYRELLKDRK PTPVIVAVID 
GGIDTTHEDL RRVLWVNPKE IAGNGKDDDK NGYVDDVHGW NFIGGKDGRN VDFETAEVTR 
LYAQLKPKYE GKDRKALKPD QQKEYDLYVK TKAEVEKNQT KYKTEYQGIS QFYKQYSEAV 
TTLKKALNVS KLDTTTLSKA ADTLTDAALK RPVMGILRLL RQQNAPNTDV VMGELEKYND 
QLKSRAEYNY NPEFNSRTIV GDNPDDMTQR DYGNPDIAGP RPDHGTHVAG IIGADRTNNL 
GIMGIADAVQ IMGVRAVPDG DERDKDVANA IRYAVDNGAK IINMSFGKDY SPQRKTVEDA 
ERYALSKGVL MIHAAGNDGK DIDTAANYPA PRFMDGSAIP NVITVGASAE PNTADLVASF 
SNYGKQNVDV FAPGKDIYST VPGSKYENNS GTSMASPVVA GVAAVLKSYF PKLTYADIKR 
IILESATPYK TKVTKPESTD TVDFSSLSKT GGVVNLYDAV KLALAQDAAS SGKGK