Gene Slin_5470 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_5470
Symbol
ID	8729237
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	+
Start bp	6656047
End bp	6657387
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	54%
IMG OID
Product	glycoside hydrolase family 1
Protein accession	YP_003390235
Protein GI	284040305
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAAACA AAGGATTTCT CGACATCATC AAAAAAAAAT ACGGCGACGG CAATTACGAC 
GGCGACCAGT TTGGCGGGGC CGGTGGGCAC GACGGCAGCG GCCCACCTCA GGATAACCCG 
GCCAATTTCA TGTTCGCGAC AGGCATCGAA TGCTCCTACC CGACTATTCA AAAAGGGAAA 
GTGCGCCGGG ATCAGTTGCG CGAGTGCGGG CATTACGACC GCTGGAAGGA AGACCTCGGC 
CTCGTGAAAG AAATGGGGCT GAACGTGTTG CGTTACGGAC TTCCCTACTT CAGCATTCAT 
CAGGCACCGG GAAAATTCGA CTGGAGCTTC GCCGATGATG TCATGCGCGA AATCAAACGG 
CTGAAAATAA CGCCCATTCT GGACCTGATG CACTTTGGCG TACCCGACTG GATCGAGAAT 
TTTCAGAACC CCGAACTGCC CATTCACTTC GCCGATTATG CCGCAGCCGT GGCCGACCGC 
TACCCGTGGG TGCGCTTTTA TACGCCGGTA AATGAGATTT ACGTCACGGC CCGCATCAGT 
GCGAAAGACG GCGTCTGGAA CGAGCAGCTC AAAACCGACA AGGGCTTCGT TACAGCCCTC 
AAACACTGCG CGGCCGCCAG CATCATGGCG AATCAGCAGA TTGCCAAACG CCGGAATGAC 
TGCGTGATCG TGCAAAGTGA AAGCGCCGAA TTTACGCATG AACTGTACGC CAAGCCTTCG 
CCCCAGATTG CGCTGGAAAA TGAACTCCGC TTTCTGTCGC TGGACTTGCT GTATGCCAAT 
GCCCCTTCGG CAACGGTAGG CATGTACCTG CTGGACAACG GCATGACCCG CGAAGAGTAT 
GACTGGTTTA TGGTAGGAAA ACCACCGGGC TACCAGGTGA TGGGGAACGA CTATTACGGC 
CGAAACGAGC GCATTAGATT AGCCGACGGT ACGATTCAGA CATCTATGGA TGTATTAGGC 
TGGTATGAGA TCACGAAAGA CTATTACGAG CGTTACCGCA TGCCCGTCAT GCACACCGAA 
ACCAACGTGT TCGAGGCCGA TCAGGCACCC ATCTGGCTGT ATAAACAATG GGTTGGGGTG 
ATGAAAATGC GTCGGGATGG CGTGCCCGTA TTGGGCTTTA CGTGGTACAG TCTCATCGAC 
CAGATCGACT GGGATTTGCA GTTGGGCGAG TTGAACAACC ACGTGAACGA GTGCGGTTTA 
TACGACCTCG ACCGCAAGCC GCGCCCGGTA GCCGAAGCCT ATAAAAGCTT ACTGAAGGAG 
TTTGGTCAGA TTACCGTTGT GCCCTATGGC GAAGTACTTG AACTAACCGA CCGGCCCGCC 
CGGCTTAAAG TTCAGGTCTG A

Protein sequence

MANKGFLDII KKKYGDGNYD GDQFGGAGGH DGSGPPQDNP ANFMFATGIE CSYPTIQKGK 
VRRDQLRECG HYDRWKEDLG LVKEMGLNVL RYGLPYFSIH QAPGKFDWSF ADDVMREIKR 
LKITPILDLM HFGVPDWIEN FQNPELPIHF ADYAAAVADR YPWVRFYTPV NEIYVTARIS 
AKDGVWNEQL KTDKGFVTAL KHCAAASIMA NQQIAKRRND CVIVQSESAE FTHELYAKPS 
PQIALENELR FLSLDLLYAN APSATVGMYL LDNGMTREEY DWFMVGKPPG YQVMGNDYYG 
RNERIRLADG TIQTSMDVLG WYEITKDYYE RYRMPVMHTE TNVFEADQAP IWLYKQWVGV 
MKMRRDGVPV LGFTWYSLID QIDWDLQLGE LNNHVNECGL YDLDRKPRPV AEAYKSLLKE 
FGQITVVPYG EVLELTDRPA RLKVQV