Gene Slin_1250 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_1250
Symbol
ID	8724983
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	-
Start bp	1527111
End bp	1528580
Gene Length	1470 bp
Protein Length	489 aa
Translation table	11
GC content	57%
IMG OID
Product	sulfatase
Protein accession	YP_003386099
Protein GI	284036169
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.820666
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	0.257041
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGTATA TATCCCTTTG TGTAGCCGGT GCGCTGCTAA CCGGTCTGAT CGCCGGGAAA 
CCATCGCCCG CACCCATTCG GCCAACGCCC AGTCAGGCCG GTGTCCGTAA ACCCAACATC 
GTGATCGTCA TGGCCGACCA GTGGCGGGCG CAGGATTTGG GCTATGCGGG CAATCGGGAG 
GTGATCACGC CGAATCTGGA TAAACTGGCC CTGGAGTCCG TTAACGCCCC CCTGTGCGTG 
GCCGAAGTGC CGGTCTGCTC ACCGAGCCGG GCCAGCCTGC TAACGGGGCA GCACGCTACT 
ACCCACGGAG TGTTTTATAA CGACCGACCG CTACGCAACG AAGCCGTCAC CTTAGCCGAA 
GTATGCCAGC AAAACGGCTA CAAAACCGGA TTCATTGGCA AATGGCATAT CAACGGCGGG 
TTAGCCAAGG ACTTCGCAGC CGGTCGTCTG GCACCGATTC CCGTTGACCG CCGACAGGGC 
TTCGAGTACT GGCGGGGGCT GGAATGCACC CACGACTACA ACAACTCGCC TTACTACAAC 
GAGGTGAACA AGCGGTTCGT CTGGCAGCAG TACGATGCCA TCAGCCAGAC CGATTCGGCC 
ATTTCGTTCA TGACCCAGTC GCGCAAGGAG CCGTTTCTAT TGGTGCTCGC CTGGGGGCCA 
CCGCACGACC CGTACCAGAC GGCCCCGAAA GAATACCGAC AACGGTACGC CGACAAAACG 
TTGTCCCTGC GCCCCAATGT ACCCGCCAAA GACACGATGG AAGCCAACCG GGCTCTGAAA 
GGATATTACG CGCATATCAA CGCCCTCGAC GACTGCATCG GTCGGTTACA GGCTGCGCTT 
AAAGGGGCTA AACTGGACGA AAACACCATT TTCGTGTTCA CCTCCGACCA CGGCGATATG 
CTGTACTCGC ACGATCAGAT CAACAAACAA AAGCCCTGGG ACGAGTCGAT CCGGATACCG 
TTTCTGCTCA AATACCCGGC GGGACTGAGT CGGAAAGGCC GCACGCTGGA TGTTCCCATC 
ACACTTACCG ATGTAATGCC TACGGTGCTG TCGCTGAGCG GCCAGACCAT TCCGGCCAGT 
GTACAGGGGC AGAACGTTGC CAGCCTGATT CGCCAGCCCC GCGCTCCCCG GCCGGACGAT 
GCCGCGCTGA TTGCCTGTAT CGTACCGTTC CACCAATGGA ATTATGGGCG CGGTGGCCGC 
GAATATCGGG GAATTCGTAC AGCACGGTAT ACTTACGTGC GCGACCTGAA AGGCCCGTGG 
CTGTTGTACG ATAATCAGCA GGACCCTTAC CAGCTGACGA ATTTGGCCAA TGAGCCTAAA 
CTGGCCGGGA CTCAGAAACA ACTTGAGGGT ATTCTAGCGC AAAAACTCCG GGCCGCCAAC 
GATAACTTCC AGGCCGGAAA CGTATACATG GATAAATGGA ATTACCCCTG GGCTTACATC 
GACTCGCTGG GCAATCCATA TTATAAGTAG

Protein sequence

MKYISLCVAG ALLTGLIAGK PSPAPIRPTP SQAGVRKPNI VIVMADQWRA QDLGYAGNRE 
VITPNLDKLA LESVNAPLCV AEVPVCSPSR ASLLTGQHAT THGVFYNDRP LRNEAVTLAE 
VCQQNGYKTG FIGKWHINGG LAKDFAAGRL APIPVDRRQG FEYWRGLECT HDYNNSPYYN 
EVNKRFVWQQ YDAISQTDSA ISFMTQSRKE PFLLVLAWGP PHDPYQTAPK EYRQRYADKT 
LSLRPNVPAK DTMEANRALK GYYAHINALD DCIGRLQAAL KGAKLDENTI FVFTSDHGDM 
LYSHDQINKQ KPWDESIRIP FLLKYPAGLS RKGRTLDVPI TLTDVMPTVL SLSGQTIPAS 
VQGQNVASLI RQPRAPRPDD AALIACIVPF HQWNYGRGGR EYRGIRTARY TYVRDLKGPW 
LLYDNQQDPY QLTNLANEPK LAGTQKQLEG ILAQKLRAAN DNFQAGNVYM DKWNYPWAYI 
DSLGNPYYK