Gene Slin_4050 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_4050
Symbol
ID	8727808
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	-
Start bp	4867228
End bp	4868589
Gene Length	1362 bp
Protein Length	453 aa
Translation table	11
GC content	42%
IMG OID
Product	type III restriction protein res subunit
Protein accession	YP_003388837
Protein GI	284038907
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0396258
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGTCCG ATATTGAATT CCCGAAAAGT GAGGAGTATC GGACCGGTAC GGAAAATGAA 
CCACTTTCTT TCTACCTGGA ATCGCTGGTA GAAAGTACCC GTTTAGATTT GCTTTTGGGC 
TATTTTAGTT CGTCGGCTAT TAGCGTGTTG GCGGTAGGAT TTGCCAAATT TATCAGTAAT 
GGTGGACAGG TACGTTTAAT TATAAATCAT ATACTTTCTG AGCAAGATAA GACAGCCGTA 
CTAAATGGGT TAACAGCAAC GGCAGATCAA TACCCCTTTT CGGTTGCTAA CTTCCAGTCG 
CTTAGAACCG CATTGGATTC GTATGGACAT CACTTTTTTG AATGCATTGC CTGGCTTATT 
GCCTCCAAAA GAATACAAAT CCGGGCTATC AAACCGAGGG GTAAGCGCGG TATTTCGCAT 
TATAAATCCG GTATCTTTTA CGATGGGCTA AATAAGGTCA AGTTTAAAGG GTCGTGTAAT 
TTTACGGCAT CGGGACTGCT TGAGAATCTT GAAGAATTAG ATATTAAATT GTCCTGGAAA 
ACCGATAGTG ATAGCTTTTC TGAGTATGAG TACGAGTATA ATCAACTATT CGCGGGGCAA 
ACCGATTATG CCGAAACTAT CCCATTTGAG CAAATTGAGG CTATAATCGT TCGCGATTTT 
GGTGGGAAAG ACCTGGATGA GTTATTAGTT GATGAGCAGA AACTAGCCTC GCAGAAGGCA 
AAGCAGATCA GAAGTCAGTT GTACCAAAAA GCGGTAGTCA AAATTTTGCA AAAGATAGAA 
ACGTACCTGA CCACACCTCG TTTTCCTTAT GAAAGCGGCC CCCGTGATTA TCAAAAAGAA 
GCCTATCAAA ATTGGGTCGA TAATAACTAT CAGGGCATCT TTGCTATGGC CACCGGTACG 
GGAAAAACAA TTACGTCGCT GAACTGTGTC TTGAATGAGT CCCAAAAAAC AGGACAGTAT 
CATACGGTTA TTTTAGTGCC AACAACAGTA TTGGTGGACC AATGGACACA CGAGGCTCGA 
AAATTTAACT TTCGTGAAAT TGTTGCCGTT TCCTCCCATT CAAAAGGTTG GCAGACTGAA 
TTAGGACGGA TTACAAATCA GCTAAGCTTT GGTATGACTA CATCATTTGT AGTCATTGTA 
ACCTACAAGT CATTTACCAA AGCCCAATTT CAGACGTATT TTAAGCGGTT ACCAGCCTCT 
ACAATATTAT TAGCCGACGA AGCCCATAAT ATAGCATCGC CTTCGGTAAG CAGACTACTT 
GACGGTGTGC ATTTACTAAA GCGTATTGGT TTGTCGGCTA CGCCCAAGCG AGTTTATGAT 
CCGGAAGGTT CAGCGCATAT GGAAGCCTTT CTTCATGTGT AA

Protein sequence

MLSDIEFPKS EEYRTGTENE PLSFYLESLV ESTRLDLLLG YFSSSAISVL AVGFAKFISN 
GGQVRLIINH ILSEQDKTAV LNGLTATADQ YPFSVANFQS LRTALDSYGH HFFECIAWLI 
ASKRIQIRAI KPRGKRGISH YKSGIFYDGL NKVKFKGSCN FTASGLLENL EELDIKLSWK 
TDSDSFSEYE YEYNQLFAGQ TDYAETIPFE QIEAIIVRDF GGKDLDELLV DEQKLASQKA 
KQIRSQLYQK AVVKILQKIE TYLTTPRFPY ESGPRDYQKE AYQNWVDNNY QGIFAMATGT 
GKTITSLNCV LNESQKTGQY HTVILVPTTV LVDQWTHEAR KFNFREIVAV SSHSKGWQTE 
LGRITNQLSF GMTTSFVVIV TYKSFTKAQF QTYFKRLPAS TILLADEAHN IASPSVSRLL 
DGVHLLKRIG LSATPKRVYD PEGSAHMEAF LHV