Gene Slin_4261 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_4261
Symbol
ID	8728020
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	+
Start bp	5143438
End bp	5144958
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	56%
IMG OID
Product	sulfatase
Protein accession	YP_003389044
Protein GI	284039114
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.362858
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACCAG CCCTTTTCCT TTTATTCAGT AGCTTATGCC TACTCGGCCA ATCGGCTGTG 
GTAGCGCAGC AGAAGCCCAA TATTGTGCTC ATCTACGCCG ATGATCTGGG CTATGGCGAC 
ATCAGCTGCA ATGGCGCGAC AAAAATCCGT ACGCCAAACA TCGACCGGGT GGCCCGCGAA 
GGATTGAACT TCACCAACGC CCACGCGTCG TCGTCGACCT GTACACCCTC GCGCTACACC 
CTCCTGACGG GTGCCTACGC CTGGCGTAAA ACAGGCACCG GCATTGCGCC AGGCGATGCC 
GCTCTGCTCA TCCCGACCGA CCGCGTCACG ATGCCCGGCA TCTTACAAAA AGCAGGCTAT 
AAGACGGGGG TCGTTGGCAA ATGGCATCTG GGACTTGGCC CCAAAGGGGG TCCCGACTGG 
AATGGCGACA TAAAACCCGG ACCGCTCGAA ATCGGCTTCA CGTACTCTTT TCTGCTACCC 
GCCACCGGCG ACCGGGTGCC CTGCGTGTAT GTCGAAAATC ACCGTATCGT CAATCTGGAC 
CCGGCCGACC CGGTTCAGGT AAGTTATAAA GAGCCGATCG GAACCGAGCC GACCGGCAAA 
GACCATCCGG AGTTGCTTAA AATGTTGTTC TCCCACGGAC ACGACCAAAC GATCATCAAT 
GGAGTTAGCC GAATTGGTTA CATGAGCGGG GGAAAGTCGG CCCGGTGGGT CGATGAGGAG 
ATGGCGGATG TGCTGACGGG CAAAGTGAAC CAGTTTATCG AGACCAGCAA AAGCGGTCCT 
TTCTTCGTGT ATTTCTCCAC GCACGACATT CACGTGCCGC GTATGCCCCA CTCCCGTTTT 
GCGGGCAAAA GTGGGATGGG GCCGCGTGGT GACGCCATTC TGCAGCTGGA CTGGTGCGTG 
GGCGAAGTCA TGAAAACCCT GGACCGGCTG GGTTTAAAAG ACAACACGAT GGTGATCATC 
AGCAGTGATA ACGGCCCGGT TGTCGATGAC GGCTACAAAG ATCAGGCGGT TGAAAAACTA 
AACGGCCACA AACCCGCCGG ACCTCTGCGT GGGGGTAAAT ACAGTGCGTT CGATGCCGGA 
ACCCGGGTGC CGTTTATCGT ACGCTGGCCG GGGAAAGTGA AGCCTGGCAT CTCCGATGCG 
CTGTTTAGTC AGGTCGACCT CGCGGCTTCT TTTGCTGAAC TAGTGGGCCA GCCATTGGCG 
AAAGGAGAAG CTCCCGACAG CTTTAATAGC CTGACGACGC TCCTGGGGAC AACTAAAAAG 
AGTCGTGAAT ACGTTATAGA ACATGCGATC AATGGCACGC TTTCGCTGAT ACGTGGCAAC 
TGGAAATACA TCGAACCTTC TGGTGGCCCG ATACTCAACC GTGAAACCAA TATCGAAACG 
GGGTATGCCC CACAGCCGCA GTTGTATAAC CTGCAAACCG ATCTTGGCGA AACGAAGAAC 
CTGGCCGAGA GCAACCCACA ACTAACTTCC GAGCTGGCCG CATTACTGAA AACCATCCGC 
GAAAAAGGAA ACACCAATTA G

Protein sequence

MKPALFLLFS SLCLLGQSAV VAQQKPNIVL IYADDLGYGD ISCNGATKIR TPNIDRVARE 
GLNFTNAHAS SSTCTPSRYT LLTGAYAWRK TGTGIAPGDA ALLIPTDRVT MPGILQKAGY 
KTGVVGKWHL GLGPKGGPDW NGDIKPGPLE IGFTYSFLLP ATGDRVPCVY VENHRIVNLD 
PADPVQVSYK EPIGTEPTGK DHPELLKMLF SHGHDQTIIN GVSRIGYMSG GKSARWVDEE 
MADVLTGKVN QFIETSKSGP FFVYFSTHDI HVPRMPHSRF AGKSGMGPRG DAILQLDWCV 
GEVMKTLDRL GLKDNTMVII SSDNGPVVDD GYKDQAVEKL NGHKPAGPLR GGKYSAFDAG 
TRVPFIVRWP GKVKPGISDA LFSQVDLAAS FAELVGQPLA KGEAPDSFNS LTTLLGTTKK 
SREYVIEHAI NGTLSLIRGN WKYIEPSGGP ILNRETNIET GYAPQPQLYN LQTDLGETKN 
LAESNPQLTS ELAALLKTIR EKGNTN