Gene Slin_2687 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_2687
Symbol
ID	8726437
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	+
Start bp	3252495
End bp	3254528
Gene Length	2034 bp
Protein Length	677 aa
Translation table	11
GC content	52%
IMG OID
Product	glycoside hydrolase family 3 domain protein
Protein accession	YP_003387502
Protein GI	284037572
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.547616
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.221922
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATCTTT TTAACAAGCG TTTTTCGTAC CACTATCTGG TCCTTTCAAC GCTTACGCTG 
GCTACTTCGG GCGTGCTGGC CCAGAAACCA ACGCAGCCTG CTCTAGGCTC GCGGTCGGTC 
AAACCACTAA CCGTTAACGG CTTTTCATTC AAAGACCTGA ATAAAAACGG AAAACTTGAC 
AAATACGAAG ACTGGCGCTT ACCCACCGAA CAGCGCGTAC AGGATTTGAT TGGCCAGATG 
ACCCTTGATG AAAAGATAGG CTTCATGCTG ATCAGCACAT CGCGAATGGC CGGCGATTTT 
TCGTTTCAGC AGGGGGCTCC AAAAGCCGAA ATCACAAGTG GCTTTAATGA AGAAGACCAG 
GTTCAGAGCA TGAATATGTT CACCCGGAAG CCACTCCCCT ACCCGATGAT GATGGCCGCC 
GGAACAACCA AAGCCGTAAC GCAGAACCAG CTACGCCATT TTATTCTGCG GGCCAACACG 
TCGGCGAAAA CCATGGCCGA ATGGCATAAC AATTTACAGG CGCTCTGCGA AAACTCCCGT 
CTGGGCATTC CGGCTATTGT AGCGTCCAAC CCGAGAAATC ACATCACCAC CGATGCCGCT 
GTTGGGCTTA GCGTTGGCAC AACGGTATTC TCAAAGTGGC CCGGCGAATT GGGTCTGGCG 
GCCATGCGCG ACTTAAAACT TACCCGCGAA TTTGCCGACA TTGCCCGGCA GGAATGGGCG 
GCTGTGGGGC TGCGCAAAGG CTATCAGTAC ATGGCCGACT TAGCAACCGA ACCGCGCTGG 
CAGCGTATTG AAGGCACATT TGGCGAAGAT GCCGATCTAG CCGCCAACAT GACCCGCGAA 
ATAGTACTCG GCTTTCAGGG ACCCAAGCTG GGCCTCCACT CCGTAGGACT TACCACCAAG 
CACTTCCCCG GTGGCGGACC GCAGGTAGAG GGGCAGGACC CGCATTTCGA CTGGGGAAAA 
GATCAGCATT ACCCCGGCAA CATGTTCGAG TATCACCTCA AGCCATTTCA GGCCGCCATT 
GATGCCGGCA CATCGTCCAT CATGCCTTAC TACGCCAAAC CCATCGGCAC AAAATATGAA 
GAGATAGCTT TTGCTTATAA TAAAGCCATT ATCAAAGATT TACTTCGCGG CAAAATGGGC 
TTTCAGGGCA TTATCAACTC CGACACGGGG CCTATTGAAA TGATGCCTTG GGGCGTTGAG 
AAGTTAAGCA TCGAGGAACG ATACCAGAAG GCTATCGAGT GCGGAGTTGA TTTGTTTTCC 
GGTTCTGCCG ATCCCTCGCT GCTGATGTCG ACCGTAAAAA AAGGACTCGT GACTGAAAAG 
CGGATCAACG AATCCGTAGC CCGGTTACTG CGTGAGGAAT TCGCGCTGGG CCTGTTTGAA 
AACCCATACG TCGACCCGGA GGTTGCACAG AAAACGGTTG GAAAACCCGA GTTTCAGCAA 
CGGGCCGATC TTGCTTTCCG GAAATCCATT GTGCTGCTGC GCAATTCGGG AAAACTGCTT 
CCGCTGGCCC CAAAAACCAA AGTCTTTATT GAGTCATACT ACGACAATGG CCGCTCTAAA 
GAGCCTATTA CGGTAATCAA ACCTGCAACG AACAACTGGA ATCTGGAGTT TGTCGGTAGC 
AAAGAAGAAG CCGATGTTGT GGTGCTGATG CTGACGCCCA GCAGCGGTAG TTTATTCAGC 
TCGAACGGCG GGCCAATTGA GTTGCAACTG TCAAAAAACA AGATCGACGT AAAGCACGTC 
AATGAAGTAA CCAGTCAGAA ACCAACCGTT GTCCTGATCA ATTACACGAG TCCGTGGGTG 
ATCGACGAAA TTGACAATCC AAACCTCAAA ACGGTACTGG CAACGTTTGG CACCACCCCC 
GACGCCATTC TGGACGTGCT GAGCGGGAAG TTCAACCCGA CCGGCAAGAT GCCGTTCAGC 
ACTCCCGTTT CCCGACAGGC CGTTCTCGAC AACCAATCCG ACGTGCCGGG CCATATGAAG 
CAAAAAGGCT ATGCGCTGTT CACCTTTGGC GATGGACTGA GCTACCCGAA CTAA

Protein sequence

MHLFNKRFSY HYLVLSTLTL ATSGVLAQKP TQPALGSRSV KPLTVNGFSF KDLNKNGKLD 
KYEDWRLPTE QRVQDLIGQM TLDEKIGFML ISTSRMAGDF SFQQGAPKAE ITSGFNEEDQ 
VQSMNMFTRK PLPYPMMMAA GTTKAVTQNQ LRHFILRANT SAKTMAEWHN NLQALCENSR 
LGIPAIVASN PRNHITTDAA VGLSVGTTVF SKWPGELGLA AMRDLKLTRE FADIARQEWA 
AVGLRKGYQY MADLATEPRW QRIEGTFGED ADLAANMTRE IVLGFQGPKL GLHSVGLTTK 
HFPGGGPQVE GQDPHFDWGK DQHYPGNMFE YHLKPFQAAI DAGTSSIMPY YAKPIGTKYE 
EIAFAYNKAI IKDLLRGKMG FQGIINSDTG PIEMMPWGVE KLSIEERYQK AIECGVDLFS 
GSADPSLLMS TVKKGLVTEK RINESVARLL REEFALGLFE NPYVDPEVAQ KTVGKPEFQQ 
RADLAFRKSI VLLRNSGKLL PLAPKTKVFI ESYYDNGRSK EPITVIKPAT NNWNLEFVGS 
KEEADVVVLM LTPSSGSLFS SNGGPIELQL SKNKIDVKHV NEVTSQKPTV VLINYTSPWV 
IDEIDNPNLK TVLATFGTTP DAILDVLSGK FNPTGKMPFS TPVSRQAVLD NQSDVPGHMK 
QKGYALFTFG DGLSYPN