Gene Slin_3920 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_3920
Symbol
ID	8727678
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	-
Start bp	4703227
End bp	4704813
Gene Length	1587 bp
Protein Length	528 aa
Translation table	11
GC content	53%
IMG OID
Product	peptidase M61 domain protein
Protein accession	YP_003388709
Protein GI	284038779
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.144473
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.231177
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCTATC GCCTGTCTGC TGATTCCTCC AGCCCCCATT ATATTGCCGT TGATGCTCAT 
TTAGCCAACA TTTCGACCTC GGAAGTTGAA CTGCAATTGC CCGCCTGGCG TCCCGGCCGC 
TATGAACTAC AGCAGTTTGC GAAAAATATT CAACGATTTG AGATCGTTGA CCAGGCCGGT 
AAACCGCTTT CGTTTCGAAA AATTACCAAA GATCGCTGGC TAGTACAAAC CGACGGCGTT 
AGTGAGCTTA CCGTTCGGTA TACTTATTAC GCCCTCCTGC CAACACCCAA CCAGCTTAAT 
GCGGGCAGCA GTTTTATCAG CGAGTCGCTC CTGTATGTTA ACCCGGTAAA CCTGTGCCTG 
TATGCCGAAG GACGCATTTC GGAGCCCTGT ACGCTGGAAC TGGCCATTCC CGATAGCTGG 
ACGGTTGCCT GTGGCCTGAC CGAAGCCCGG TCCGAACAAC CCAATATACG TACGTTACTG 
GCCGCTGATT TTTATGAACT GGTCGATTGC CCGCTCATAG CTGCTCCGGT TATTCAGGAT 
ATACAGTACA CCGTGGGCGA TACGGATTTT CACGTCTGGA TTCAGGGCGG TCGGCGGACG 
GATGGTAATC CCACCTTCGA TGCCGACCGG ATTGTGGCCG ACTTCCGGCG TTTTTCGGTG 
AAGCAGATCG AACTTTACGG CGAGTTTCCC GAAAAGGCGT ATCATTTCCT GACGCTCATT 
CTACCTGTTC CCTACTATCA CGGTGTCGAA CACCGCAACT CGACCGTACT GACGCTCGGC 
CCGAACGATG AGGGAGAGGG GCTGTATCAG GATTTGTTGG GGGTTTCGTC GCACGAGTTG 
TTTCATGCCT GGAACATTAT CCGCATTCGC CCTACCGAAC TGCTGCCGTA CGATTTTACG 
AAGGAGAATT ATTTTACGAC CTGCTTTGTC GCCGAGGGCG TAACGACCTA TTACGGCGAT 
TTAATGCTGC GGCAATCGGG CGTGTTTACC GACGAAGCGT ATTTAAAAGA ATTACAGGTT 
TTGCTGAAGC GTCATTTCGA GAACAACGGG CGGGCCTTCC AGTCGCTTAC CGAATCGTCC 
TGGGATTTGT GGCTCGACGG TTACGACAAG GGCGTTCCCG ACCGCAAAGT GTCGGTTTAC 
CACAAAGGAG CCATTGCCGC TCTGATTCTT GACCTGCACA TCCGACAGGT AACCGACCAC 
GCCCGCTCGC TGGACGACGT TATGCGCCAG ATGTGGCAGC GTTTCGGTAA ACCATTCATT 
GGCTATACCC TGGACGATTA CCGCGCCGTA ACCGAAGCCG TTGCGGGCGA GCCGCTTGAC 
TGGTATTATG CCGTGTGTAT CTTTGGCAAT CAGCCACTTG AACCCTTGCT GAACAAGTAT 
CTGGCGTGGG TTGGCCTGCT GGTCGCCTAT GAAGAGCCAA CGCCCGACCA GCCGGGTGGC 
ATACGCTTAC TGGAGATCGA CAGCCAGGAA GGTCGTCAGC ATCGAGCTCG GTGGTTTGGG 
CAAGTAAAAG TTGACGAGCC TGTTTCAGAA GGGAGTGTAC ATCCTGTACC TCAAGAGAAA 
CTGGGTAAAA ACGTAGTTGC GAAATGA

Protein sequence

MRYRLSADSS SPHYIAVDAH LANISTSEVE LQLPAWRPGR YELQQFAKNI QRFEIVDQAG 
KPLSFRKITK DRWLVQTDGV SELTVRYTYY ALLPTPNQLN AGSSFISESL LYVNPVNLCL 
YAEGRISEPC TLELAIPDSW TVACGLTEAR SEQPNIRTLL AADFYELVDC PLIAAPVIQD 
IQYTVGDTDF HVWIQGGRRT DGNPTFDADR IVADFRRFSV KQIELYGEFP EKAYHFLTLI 
LPVPYYHGVE HRNSTVLTLG PNDEGEGLYQ DLLGVSSHEL FHAWNIIRIR PTELLPYDFT 
KENYFTTCFV AEGVTTYYGD LMLRQSGVFT DEAYLKELQV LLKRHFENNG RAFQSLTESS 
WDLWLDGYDK GVPDRKVSVY HKGAIAALIL DLHIRQVTDH ARSLDDVMRQ MWQRFGKPFI 
GYTLDDYRAV TEAVAGEPLD WYYAVCIFGN QPLEPLLNKY LAWVGLLVAY EEPTPDQPGG 
IRLLEIDSQE GRQHRARWFG QVKVDEPVSE GSVHPVPQEK LGKNVVAK