Gene Slin_5375 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_5375
Symbol
ID	8729140
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	-
Start bp	6536379
End bp	6538061
Gene Length	1683 bp
Protein Length	560 aa
Translation table	11
GC content	52%
IMG OID
Product	sulfatase
Protein accession	YP_003390142
Protein GI	284040212
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTAAAC CGACCGTTTT TCGCTCGCTG CTGGGTGCAA CTGCCGTGGC TCTGCTGCTG 
GCTATACCCG GCTACACCCC TGTTCCGCTG GAGGAGCCTC AACCCAACCG TGCGGCTCAA 
CAGCGACCTA ATGTGATTTT CATCATTTCT GACGATCACA CATCACAGGC CATCAGTGCG 
TATGGCAGCA AACTGGCTAA AACGCCCAAC ATCGACCGAA TTGCCCGGGA AGGAGCCATT 
CTTTATAACA ATGTTGTGGC CAACTCGATC TGCGGCCCCA GTCGCGCTAC CTTGCTGACT 
GGCCAGTTCT CGCACCGGAA CGGATACAAA TTCAACGAAA AGGTATTCGA TATCAGCCAG 
CCGGTTTTCA CTGAGGAGTT GCAAAAGAAC GGCTACCAAA CGGCCTGGAT CGGCAAAATG 
CACCTGGGGA GCCTGCCCCA CGGATTCGAT TACCTGAATA TTCTGCCGGG GCATGGCAAT 
TATTACAATT CGGATTTTGT CGACTCCAAT AACAAAACGA CCCGGCACAT GGGTTACGTG 
ACCGATGTCG TAACGAGCCT CTCCACCGAC TGGCTCGCTC ACCGCGATAC GGCGAAACCT 
TTCTTTCTGG TGGTTGGTCA CAAAGCGACC CACCGTGAGT GGATGCCCGC TGTGGAGGAT 
TTAGGCGCTT ACGACAACGT CACGTTTCCT ATACCGCCCA CGTTTTATGA CGACTATGAG 
GGTCGGTTAG CGGCTCAAAA GCAGGAAATG AGCATCGACA AGTCAATGAA TCTGAGAGCA 
GATCTGAAAG TCGATGTTAA ATATGAGGCT GATGAAGCCA CGATGGAGCA GGAAAAGGCC 
GACTTTCGGA AGGCGTTTTA CGGGTCCAAT CAACCTACCC CGGCGCAGGA AAAACAGCTG 
GACACCTACG TTCGGGAAGG CTCGTACCGA CGCCTGAACC CCGAACAGAA AAAAGCCTTT 
TCCAGCTATT ATGGCAAAAT CAGTAAGGAG TTTGCCGATA AAAAGCTGAC CGGTAAAGCC 
CTGGCGGAGT GGAAATATCA GCGTTATCTG AAAGATTATC TGTCTACCGC CAACTCGCTG 
GATCGCAACA TCGGCAAGCT GCTCGATTAC CTGGATAAAA GCGGACTGGC TAAAAATACC 
GTAGTCGTAT ACACCTCCGA TCAGGGCTTT TACCTGGGCG AACACGGCTG GTTCGATAAG 
CGGTGGATTT ATGAGGAATC CCTGAAAACG CCGTTTGTAA TCCGGTATCC GGGCGTTATC 
AAACCGGGCA GTCAGGTGAA GCAGGTCGTA TCGAATGTCG ATTGGGCCCC CACCTTATTG 
AGCCTGACGG GCACGCGTGT TCCCGACTAT GTGCAGGGCG AATCGTTCCT GCCGCTGCTG 
ACCGGCGGCA AAAACGACTG GCGAAATCAG GCTTACTACC ACTATTATGA GTACCCACAG 
CCGCACCATG TCTCGCCCCA TTTCGGGTTG CGTACGGCTC AGTACACGCT GGCTCGTTTT 
TACGGCCCGG AAGACTTTTG GGAACTGTAC GACATCCAGA AAGACCCCCA GAATCTTAAC 
AATGTGTACG GTCAGAAAGG CTACGAAAAA GTAACGGCTC TGCTGAAAAA GCAGTTGAAG 
GACCAAATCA TTAAGTACAA AGATGAGGAA GCACTCAAGT TGATGGCCGC AAATCCGCAG 
TAG

Protein sequence

MSKPTVFRSL LGATAVALLL AIPGYTPVPL EEPQPNRAAQ QRPNVIFIIS DDHTSQAISA 
YGSKLAKTPN IDRIAREGAI LYNNVVANSI CGPSRATLLT GQFSHRNGYK FNEKVFDISQ 
PVFTEELQKN GYQTAWIGKM HLGSLPHGFD YLNILPGHGN YYNSDFVDSN NKTTRHMGYV 
TDVVTSLSTD WLAHRDTAKP FFLVVGHKAT HREWMPAVED LGAYDNVTFP IPPTFYDDYE 
GRLAAQKQEM SIDKSMNLRA DLKVDVKYEA DEATMEQEKA DFRKAFYGSN QPTPAQEKQL 
DTYVREGSYR RLNPEQKKAF SSYYGKISKE FADKKLTGKA LAEWKYQRYL KDYLSTANSL 
DRNIGKLLDY LDKSGLAKNT VVVYTSDQGF YLGEHGWFDK RWIYEESLKT PFVIRYPGVI 
KPGSQVKQVV SNVDWAPTLL SLTGTRVPDY VQGESFLPLL TGGKNDWRNQ AYYHYYEYPQ 
PHHVSPHFGL RTAQYTLARF YGPEDFWELY DIQKDPQNLN NVYGQKGYEK VTALLKKQLK 
DQIIKYKDEE ALKLMAANPQ