Gene Slin_0149 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_0149
Symbol
ID	8723877
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	-
Start bp	187122
End bp	188279
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	57%
IMG OID
Product	Sarcosine oxidase
Protein accession	YP_003385014
Protein GI	284035084
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.00237457
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGATCTTTG ATGCGATTGT TGTTGGATTA GGCGCTATGG GCAGTGCCAC CCTCTACCAG 
CTTGCCAAAC AGACCCCCAA TGTGCTCGGC CTCGATCAGT TTGCGCCCCC GCACACCCTG 
GGCTCTACGC ACGGCGACAC CCGCATTACC CGCCAGGCCA TTGGCGAAGG AGCCCACTTC 
GTACCGCTGG CCCTTCGCTC CTACGACATC TGGCGCGAAC TCGAACAGCG CACCGGCGAG 
GAATTACTAA CCATTACGGG TGGGCTGTTT ATCGGGCAGG AACACTCGCC CGTTCAGATG 
CACAATAAGC CCGGCTGGCT CAGCACCACC ATTCGGGCCG CCGAACAATT TGGTATCGCC 
CATCGGCTGC TGGATCATGC AGCCCTTCGG CGCGAATTTC CGCAGTTCAG ATATCGCCCC 
GACGATATTG GGTATTATGA AGAAGAAGCC GGTTTTTTGA AGCCGGAGCG ATGCATTTCG 
GTTCAGTTGG AACAGGCCCG GCAGTATGGG GCGTCTGTCC GGACCAACGA ACGGATGGTA 
GCTTTTGACG CCACGAAGAC GGGTATTACC GTTCGGACGG AACAGGGCGT TTACCAGACC 
CGAAAGCTGA TTTTGACCAC CGGGTCTTGG ATTACGGAGT CGCTGCGCCA TACGCCCTAT 
CAGGAGTTGC TTACCGTATA CCGTCAGGTG CTGTACTGGT TCGCTATTGA GGGCAACTAT 
ACACAGTATA CGCCGGATAA GCTACCGGTA TTTATTCTGA GCGAGCGAGA CCTGTACGGA 
TTCCCGGCGG TGGGCGGTCC CGCTGGTGGT TTGAAAATTG CCACCGAAAC CTACGCCCAC 
GCAACGAGTC CGCAGGTTGT AGACCGCACC GTCAGCGAAG CCGAAACACG ACGCATGTAC 
GAAGAGCACA TTGCGCCCAA CTTCGTGGGG GTCGGTCCGG CCTGTGTCAA GTCCGTTGTA 
TGCTTGTATA CGATGACACC AAACGGCGAT TTTATCATCG ACCAGCATCC AGACCATCCC 
GATGTACTGC TGGCTTCGGC CTGTTCGGGG CACGGTTTCA AACATTCGGC GGCCGTTGGG 
CAGATTCTGG CTGAATTAAC CCTTCAGAAC AGGACCGGCT TTTCGATCGA GCCTTTCCAG 
CTAGGCCATT CGCGTTAG

Protein sequence

MIFDAIVVGL GAMGSATLYQ LAKQTPNVLG LDQFAPPHTL GSTHGDTRIT RQAIGEGAHF 
VPLALRSYDI WRELEQRTGE ELLTITGGLF IGQEHSPVQM HNKPGWLSTT IRAAEQFGIA 
HRLLDHAALR REFPQFRYRP DDIGYYEEEA GFLKPERCIS VQLEQARQYG ASVRTNERMV 
AFDATKTGIT VRTEQGVYQT RKLILTTGSW ITESLRHTPY QELLTVYRQV LYWFAIEGNY 
TQYTPDKLPV FILSERDLYG FPAVGGPAGG LKIATETYAH ATSPQVVDRT VSEAETRRMY 
EEHIAPNFVG VGPACVKSVV CLYTMTPNGD FIIDQHPDHP DVLLASACSG HGFKHSAAVG 
QILAELTLQN RTGFSIEPFQ LGHSR