Gene Slin_3166 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_3166
Symbol
ID	8726919
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	+
Start bp	3835438
End bp	3836574
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	51%
IMG OID
Product	protein of unknown function DUF692
Protein accession	YP_003387976
Protein GI	284038046
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.681272
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	50
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCAGAC TATACTCATC CCTTGCCTGC AATCTGGATA CCAACAGCTT ACAGGCATCG 
CTTCCTCTTT TTGAAGCTGA AAAAGTTCAG GCCATTGAGT GGTCGTTCGA TACACTGTTT 
GCCCTTGGCG AAATGCCCGA CTGGTTTGCG GAATTGCTCC GCGCTTACAG TCAGGAAGGT 
CGATTGATTG GGCACGGCGT TTTCTTTTCT CTCTTCTCCG GCAAATGGAC GCCAGACCAG 
CAGCAGTGGC TGAAGCAGCT CAAGGCATTG TCGGCCGACT TTACTTTCGA TCACCTCACT 
GAACATGTCG GTTTTATGAC CGGTGAGGAT TTTCATAAGG GTGCCCCCAT CAGCATTCCT 
TTTACGACCT CAACGCTGGC GATAGGCCGC GACCGGCTGC TACGGCTCCA GGATGCGGGT 
AACTGCCCGG TTGGTCTGGA GAACCTGGCA GTCGCTTACT CGCTCGACGA TGTAAAACGG 
CAGGGTGACT TTCTGGCTCA ACTGCTCGAA GCAGTCAATG GATTCATTCT TTTAGACTTA 
CATAATCTGT ATTGCCAAAG TCAGAACTTC GACCTAGGCA TTGCTGATAT ACAAGCGCTG 
TACCCCCTCG ACCGTGTCCG CGAAATTCAT ATATCGGGTG GAAGCTGGGT GCCATCCACC 
GTCAATCCGA CAAAACAGAT CCGGCGGGAC ACGCACGATG AGTCAGTACC AGCAGCGGTT 
TTCCACGCGC TGCAACAAGT TATCGGCCAA TGCCCTAACC TGAAATATGT AGTGCTTGAG 
CAACTGGGCA CTGGCCTCAC GACAGATGTA AGTCGTCAGC ATTTTCGGGA GGACTTCTAT 
ACGATGGATG CCCTTATTGA AGCTACCAAC CAGCTAAACA GTCATTCGCC GATCAACTCT 
TTCCTGCCTT TATCTGAAAC AAGCATTCCC GAAACGCCAA TGGAGAATCC ATTGCTTAAC 
CAACAACAGA CTGAACTATC GGCCATACTG GAAACCGCTA CGGATTATGG TCAGGCTCAG 
TTGTTTCTGA ACGCATCAAG TCTGGCGAAT TCAGATTGGA ATATCGAGAA CTGGCAACCG 
GAAATGCTCG AAACAGCCCT TGCCATCGCT CAGAAATGGA AAGATGGGTT GGTGTAG

Protein sequence

MSRLYSSLAC NLDTNSLQAS LPLFEAEKVQ AIEWSFDTLF ALGEMPDWFA ELLRAYSQEG 
RLIGHGVFFS LFSGKWTPDQ QQWLKQLKAL SADFTFDHLT EHVGFMTGED FHKGAPISIP 
FTTSTLAIGR DRLLRLQDAG NCPVGLENLA VAYSLDDVKR QGDFLAQLLE AVNGFILLDL 
HNLYCQSQNF DLGIADIQAL YPLDRVREIH ISGGSWVPST VNPTKQIRRD THDESVPAAV 
FHALQQVIGQ CPNLKYVVLE QLGTGLTTDV SRQHFREDFY TMDALIEATN QLNSHSPINS 
FLPLSETSIP ETPMENPLLN QQQTELSAIL ETATDYGQAQ LFLNASSLAN SDWNIENWQP 
EMLETALAIA QKWKDGLV