Gene Slin_5543 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_5543
Symbol
ID	8729317
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	+
Start bp	6753641
End bp	6755011
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	51%
IMG OID
Product	protein of unknown function DUF224 cysteine-rich region domain protein
Protein accession	YP_003390308
Protein GI	284040378
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAATTT TTCAACAAAT TTTATTTGTC GCGGCTTTAG CAGCCGTGGC CTGGTACATA 
ACCAAGCGAA TTCAGCTCAT TTCCCGAGCC ATTAAGCTCG GACGCGCCGA AAATCGGACC 
GATCATTCCG ATGAGCGATT AAAAACAATG CTTCTGGTTG CCTTCGGTCA GAAGAAGATG 
TTCACCAATC CACTGGTTGG TGTCATGCAC TTTATCATTT ATGCCGGGTT TATTATTATC 
AACCTCGAAA TTCTGGAAAT CATTCTGGAT GGTATTCTGG GTACGCACCG GCTATTTGCG 
CCTTACATTA CGCCCGTTTA TCCCTTTCTG ATCAACATAT TTGAGATACT GGCTTTTGGG 
GTGCTGGCCG TTTGCGTGGT GTTCCTGTGC CGTCGGTTTG TGGCGAAAGT AAGCCGGTTT 
CAGCCGGAGC GCCACCGCGA GATGGCTCGC TGGCCCCAGG CTGATGCGGC TATCATTCTG 
ACCGCCGAAA TTCTGCTCAT GATCGCGTTC CTGACCTGGA ATGCATCTGA TAGCGTTTTA 
CGCGATAGGG GAGTTGGCCA TTATGGCGAG TTACAGGGCA TTGTGCCGGA CTTTATCATC 
AGTCAGTACC TGAAGCCGCT GTTCGCAAAC TTCAGTGACA CCGCGCTGGT AGCCTATGAG 
CGGATTTCCT GGTGGTTTCA TATTCTGGGT ATTCTGGCCT TCGCCGTGTA TGTGACTTAC 
TCTAAGCATC TGCACATTGC ACTTGGCTTT CCGAACGTCT ACTTCTCGGA CCTGCAACCT 
AAAGGCGAGA TGCAGAACAT GCCCGAAATC ACCAAAGAAG TTCAACTCGC ATTGGGCCTG 
CCTGTTACAA CTGAAATGGA CGGTTCACAA ACGAATGACA ACGGAGAGCA GCCAGCCGAA 
ATCGGCCGGT TTGGCGCTAA AGATGTGCAG GATTTGAAAT GGATCAACCT GATGAACGCT 
TACAGCTGCA CCGAGTGCGG GCGTTGTACG GCAGCTTGTC CGGCTAACAT CACGGGTAAG 
AAGCTTTCGC CCCGCAAGAT TATGATGGAC ACCCGCGACC GGCTCGAAGA AATACAGCAG 
GGTTGGAAAA CGAATGGCCC GGACTACCGC GACGATAAAT CCCTACTGAA TGATTACATC 
ACCGCCGAAG AGCTCAACGC CTGCACTACC TGCCAGGCTT GTGTAATGGC CTGTCCGATC 
AATATTAATC CGCTGGACAT TATCCTTCAG CTACGCCGGT ATCGCGTCAT GGAAGAATCG 
CAGGCACCTG CCTCCTGGAA TGCGATGTTC AGCAATATCG AAAACAACAT GGCTCCCTGG 
AAATTCTCAC CCAGCGACCG CTTTAACTGG GCTGACCAGG TGAATGATTA A

Protein sequence

MEIFQQILFV AALAAVAWYI TKRIQLISRA IKLGRAENRT DHSDERLKTM LLVAFGQKKM 
FTNPLVGVMH FIIYAGFIII NLEILEIILD GILGTHRLFA PYITPVYPFL INIFEILAFG 
VLAVCVVFLC RRFVAKVSRF QPERHREMAR WPQADAAIIL TAEILLMIAF LTWNASDSVL 
RDRGVGHYGE LQGIVPDFII SQYLKPLFAN FSDTALVAYE RISWWFHILG ILAFAVYVTY 
SKHLHIALGF PNVYFSDLQP KGEMQNMPEI TKEVQLALGL PVTTEMDGSQ TNDNGEQPAE 
IGRFGAKDVQ DLKWINLMNA YSCTECGRCT AACPANITGK KLSPRKIMMD TRDRLEEIQQ 
GWKTNGPDYR DDKSLLNDYI TAEELNACTT CQACVMACPI NINPLDIILQ LRRYRVMEES 
QAPASWNAMF SNIENNMAPW KFSPSDRFNW ADQVND