Gene Slin_0166 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_0166
Symbol
ID	8723894
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	-
Start bp	203659
End bp	204897
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	52%
IMG OID
Product	cysteine desulfurase, SufS subfamily
Protein accession	YP_003385031
Protein GI	284035101
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0000000385676
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	0
Fosmid unclonability p-value	0.00000000000000152095
Fosmid Hitchhiker	No
Fosmid clonability	unclonable

Sequence

Gene sequence

ATGCAATCAG CGATAGAAAC AACCTTGGAT ATACAGCAAA TACGCCGGGA TTTTCCCATA 
CTCGATCAAC AGGTGAACGG TCGTCCGCTG GTGTATTTAG ATAATGCCGC CACCAATCAG 
AAACCGACGG CGGTCATCAA GGCCCTGACG GATTATTACG AAGGGTACAA TGCCAACATT 
CACCGGGGTA TTCACCACCT GGCCGAAAAA GCGACGGCGG CTTTCGAAGC GTCGCGCCGG 
GCATTTCAGG ATTTTTTGAA TGCCAAACAC TGGCAGGAGA TCATCTTCAC GTACGGCACC 
ACCGATGGCA TCAACCTGGT GGCGCAAACC TACGGACGCC AGTTTCTGAA CGAAGGCGAC 
GAGATCATTA TCTCGACCAT GGAGCACCAT TCCAACATTG TGCCCTGGCA GATGCTATGT 
GAGGAAAAAG GCTGCATCCT GAAAGTCATT CCCGTCAACG ACGAAGGTGA ACTGCTCATT 
GACGAGTACG AAAAGCTGCT GACGGAGCGC ACTAAATTCG TTTCGTGCGT CCATGTGTCG 
AACTCGCTGG GCACCATCAA CCCCGTCAAA ACCATCATCG ACAAAGCCCA TGCGGTTGGC 
GCGGTGGTGC TGATCGACGG TGCACAGGCC AGTTCGCACC TGGAACTCGA CGTACAGGCG 
CTTGACGCTG ATTTTTATGT TCTGTCGGCT CATAAATTAT ATGGACCAAC GGGCATGGGC 
GTATTATATG GTAAAAAAGA ACTCCTCGAT GCCATGCCTC CCTACCGGGG TGGTGGCGAA 
ATGATTAAGG AAGTAACGTT CGCCAAAACG ACCTATAACG AGATTCCCTA TAAATTTGAA 
GCGGGTACAC CCAACATTGC CGATGTGATT GCCGTCAAAA CGGCTCTCGA CTACATGGCA 
GGTCTGGGTA AAGAGAACAT TGCGGCTCAC GAAAACGATC TGCTTCAGTA CGCCACCGAG 
CAATTGAGCG AGTTGGACGG TCTCCGTATC ATTGGCCGGG CAACGCACAA AATTGGCGTT 
GTTTCGTTTG TGCTCGACGG CATTCACCAT CAGGATACGG GCGTTATTCT GGACCAACAG 
GGCATTGCCG TCCGGACGGG TCACCATTGC ACCCAGCCGC TCATGCAACG CTTTGGTATT 
GCCGGAACTA CGCGGGCATC GTTCGCGGTT TATAACACCA GAGACGAAAT CGACCGGCTT 
GTTCAGGGCC TTCGACGGGT TCAGAAAATG ATGTTATAA

Protein sequence

MQSAIETTLD IQQIRRDFPI LDQQVNGRPL VYLDNAATNQ KPTAVIKALT DYYEGYNANI 
HRGIHHLAEK ATAAFEASRR AFQDFLNAKH WQEIIFTYGT TDGINLVAQT YGRQFLNEGD 
EIIISTMEHH SNIVPWQMLC EEKGCILKVI PVNDEGELLI DEYEKLLTER TKFVSCVHVS 
NSLGTINPVK TIIDKAHAVG AVVLIDGAQA SSHLELDVQA LDADFYVLSA HKLYGPTGMG 
VLYGKKELLD AMPPYRGGGE MIKEVTFAKT TYNEIPYKFE AGTPNIADVI AVKTALDYMA 
GLGKENIAAH ENDLLQYATE QLSELDGLRI IGRATHKIGV VSFVLDGIHH QDTGVILDQQ 
GIAVRTGHHC TQPLMQRFGI AGTTRASFAV YNTRDEIDRL VQGLRRVQKM ML