Gene Slin_3089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_3089
Symbol
ID	8726842
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	+
Start bp	3747015
End bp	3748577
Gene Length	1563 bp
Protein Length	520 aa
Translation table	11
GC content	42%
IMG OID
Product	restriction modification system DNA specificity domain protein
Protein accession	YP_003387899
Protein GI	284037969
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.497517
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.376247
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTATTG CAGAGTTTTA TAAAAAAGTC GACACATCAG TCGCAGTTGC TAAGATTGTA 
TTCAACTACC TATCAGATCA TAACATCGTT AAGCGCATAG GTAGTATAGC TGAAACAAGC 
AGTGGAGGTA CACCTACAAG GGGGAATCCT GAATTTTATA ATGGCACTAT TCCTTGGCTA 
AAGTCGGGAG AATTAAATGA CGGATTAATA ACGGAGTGCG AGGAGTATAT AACTGAAAAA 
GGATTAAAGA ACTCGTCAGC AAAACTTTTC CCCGAAGGCA CTCTTTTAGT AGCCATGTAT 
GGCGCAACGG CAGGTAAGGT AGGTATTTTA AGTTTTGATG CTTCAACTAA CCAAGCAGTA 
TGCGCCGTAT TTCCGAAGGC TGATATTGAA CGAGATTTTC TATTCTGGTA TTTTCGTCAA 
CAGCGTTTTG ACTTTATTGA AATAAGTAAA GGTGGAGCAC AGCCAAATAT TAGTCAGACT 
GTAATCAACA ATGCTGTAAT ACCAATTCCC GAAGTTGCAG TTCAAAAACA AGTTGTTAAA 
TTTCTTAATA TACTGGAAAC CGAACAACGC ATTGATAATA ATTTAGTACT GAATGAGGAA 
GTTGCGCAAC AAATCGCTCG CTACTTTAAA ATTAGAACCG AAGCCGCAGA GGTTGAAGAC 
ATATATATAG AGCAAAAAAA ACTCCTTACT CAATTACGTC AGTCCATTTT GCAGGAGGCC 
GTTCAAGGGA AACTGACAAA GAAGTTTAGG GAGACAGAAA AATTAGCACA ACAGGATCAT 
GTTCGAGTCC TGGGTTCGAA TCCCAGCCGG ACCGCAACAC CTCAACTCGA AACCGGCGCT 
GATTTACTAG CCCGTATCCG CGCTGAAAAA GCCGAACTCA TCCGGCAAGG AAAACTACGC 
AAAGAGAAAC CCCTGCCCCC CATTACTGAT GCCGAAAAGC CTTTTGAGTT GCCTGAGGGC 
TGGGTTTGGT GCCGGTTGGG AGATGTGTGC GAGAGTTCCT TTTACGGCCC TAGATTTAGC 
AATGGCGACT ATATAAAGAA TGGCATCCCA ACTATCAGAA CTACAGACAT GACTGATGAT 
GGTAGAATCG TTTTAAAAAA TACCCCAATG GTTAAAGTGT CATCGTCTAA ACTGGAATTA 
TACCAAGTAC TTGATGGAGA TTTACTTATA ACTCGTAGCG GCAGTATAGG CATTATGGCG 
GTATTCAGAG GTAGTTACAC AGCTATACCG AGTGCTTACC TAATACGATT CAGATTTGTT 
TCGAGTATAT TCCCTGAGTA CGTTTTTAGT GTATTAAAAG CGCCTTTCTG GCAAAGGCTA 
ATGGGATTAA GCACAACCTC TACTGCTCAA GTTAATATCA ACGCGAGTTC AATCAACAGT 
TTCCTTATTC CACTCCCATC CTTCACAGAG CAACAAGCCA TTGTCGCTCA AGTCAAGCAA 
TTATTAAACC AGGTGAGCGC GTTGGAAATT GAAAATAAAC AACAACAAGT CGAGGTTAGC 
CAACTGATGC AGGTAGTGTT GAGCGAGGCT TTTGCGGGGA AAGAAACGGC GCTATCAGCG 
TAG

Protein sequence

MTIAEFYKKV DTSVAVAKIV FNYLSDHNIV KRIGSIAETS SGGTPTRGNP EFYNGTIPWL 
KSGELNDGLI TECEEYITEK GLKNSSAKLF PEGTLLVAMY GATAGKVGIL SFDASTNQAV 
CAVFPKADIE RDFLFWYFRQ QRFDFIEISK GGAQPNISQT VINNAVIPIP EVAVQKQVVK 
FLNILETEQR IDNNLVLNEE VAQQIARYFK IRTEAAEVED IYIEQKKLLT QLRQSILQEA 
VQGKLTKKFR ETEKLAQQDH VRVLGSNPSR TATPQLETGA DLLARIRAEK AELIRQGKLR 
KEKPLPPITD AEKPFELPEG WVWCRLGDVC ESSFYGPRFS NGDYIKNGIP TIRTTDMTDD 
GRIVLKNTPM VKVSSSKLEL YQVLDGDLLI TRSGSIGIMA VFRGSYTAIP SAYLIRFRFV 
SSIFPEYVFS VLKAPFWQRL MGLSTTSTAQ VNINASSINS FLIPLPSFTE QQAIVAQVKQ 
LLNQVSALEI ENKQQQVEVS QLMQVVLSEA FAGKETALSA