Gene Slin_4678 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_4678
Symbol
ID	8728442
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	-
Start bp	5699307
End bp	5700530
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	57%
IMG OID
Product	peptidase S8/S53 subtilisin kexin sedolisin
Protein accession	YP_003389455
Protein GI	284039525
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.264127
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.283017
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCAATC ACTCCCTGAA AAAAGTTCTA TGGTCGGCGT TAGTTCCGGC GTTACTTGCG 
GCCTGTCAGC CCACGGATAC GTTCCAGCGT CAGCCGGATG ATGTGGTTCG TTATGGTAGT 
CAGACAGGGT CGGCGCGGGC CGCTGCCGAT GTGCAGAAGT ACATTGTTAC CTTTAAAGCC 
GACCCACTCA TTACCCGCTC GCTGCCCGAC AATGCCGGAG CGTATGATGC CCGGGTACAA 
CAGATGCAGG GGCTGATTTC CCGACTGGTA GGAGCCGATA TTGCCGGCAA AACCCAGGAG 
GTGTACACAA CGGCGATCCG GGGCTTTGCC GTTGAACTAA CAGCCGCCGA ACTGGCCCGG 
CTGCAGCGAC TGCCGTTCAT TGCCAGTATC GTACCCGATC AGGTTGTGTC ACTGGCCGTG 
CCAACTGGTA CTGCCATAAC GATAGGAGCG CAGACTATAC CCTGGGGAAT TAGCCGGGTG 
GGTGGCGTTC GAACCTATAC GGGTTCACAT AAGGCCTGGG TGCTGGATAC AGGTATTGAT 
TTCGATCATC CCGACCTGAA TGTCGACCTG CCGCTGTGCC GTAATTTCAA TAACCCACGT 
CGCGATGCCG ACGACGACAA CGGACATGGC TCGCACGTGG CCGGTACCAT TGGCGCTAAA 
GACAATAACT TTGGTGTAGT GGGTGTTGCG CCGGGCGTAA AAGTAATCGC CGTGAAGGTA 
TTATCGGCGA CGGGGAGTGG TTCTTACTCC GGTGTTATTG CCGGTATCGA CTACGTTGCC 
ACGGCCGGTG CAGCGGGCGA TGTAGTGAAC ATGAGTCTGG GCGGACCCGT TTATACGCCG 
ATCGATGAAG CGGTAAAAGG AGCAGCCAGC AAAGGAATCC TGTTTGCACT GGCTGCAGGC 
AACGAGTCGC AGAATGCCAA TAACTCCTCT CCGGGCCGTA CGGAACACCC CAACGTGTAT 
ACGGTTTCGG CCCACGACTA TAACGATAAA TTTGCGTCGT TCTCCAACTA CGGCAATCCG 
CCCATCGACT GGTGCGCACC GGGTGTCGAT GTGCTGTCGA CCTGGCGTTC GGGCGGTTAC 
CGGACTATCA GTGGTACCTC AATGGCAACG CCCCACGTAG CAGGTATCCT GCTCTACGGC 
ACGCCGGCTT CCCGCGGACC AGTATCCGGC GACCGCGATA GCACTCCGGA CCAGATGGCC 
AAGCTACCAA CGGTAACGCC CTAA

Protein sequence

MFNHSLKKVL WSALVPALLA ACQPTDTFQR QPDDVVRYGS QTGSARAAAD VQKYIVTFKA 
DPLITRSLPD NAGAYDARVQ QMQGLISRLV GADIAGKTQE VYTTAIRGFA VELTAAELAR 
LQRLPFIASI VPDQVVSLAV PTGTAITIGA QTIPWGISRV GGVRTYTGSH KAWVLDTGID 
FDHPDLNVDL PLCRNFNNPR RDADDDNGHG SHVAGTIGAK DNNFGVVGVA PGVKVIAVKV 
LSATGSGSYS GVIAGIDYVA TAGAAGDVVN MSLGGPVYTP IDEAVKGAAS KGILFALAAG 
NESQNANNSS PGRTEHPNVY TVSAHDYNDK FASFSNYGNP PIDWCAPGVD VLSTWRSGGY 
RTISGTSMAT PHVAGILLYG TPASRGPVSG DRDSTPDQMA KLPTVTP