Gene Slin_5014 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_5014
Symbol
ID	8728779
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	-
Start bp	6111984
End bp	6113591
Gene Length	1608 bp
Protein Length	535 aa
Translation table	11
GC content	52%
IMG OID
Product	Alpha,alpha-trehalase
Protein accession	YP_003389790
Protein GI	284039860
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATTAC CACCGGCGAA CAGATTCATC CTTCTCTTCT CGCTACTTTG CCTGACACCC 
GCCTGGAGTC AGGCAGTTTT TGAGAAACCC CAGTCAACGA CATTGAATTT GGCGAGTCCT 
GACGAACAGT TCGGGGCGTT GTTTGAAGCT GTTCAGTTAA AAGCCGTCTT TCCGGATTCG 
AAAACATTTG CTGACTGCAC CCCCAAATTT CCAATAGCCA CCATTCTGGC AAGCTATGAA 
AGTGCGCGGC AACGCAGCGA CTTCGATCTG AAAACGTTTG TTACCCAGAA TTTCACGCTA 
CCCATCAAAC CGGCGTCTGG CTACACCAGC AAAGCAGGAC AAACGGCCCA GGAGCACATT 
ACTGATTTAT GGTCCGTACT TACCCGACCG GCATCGACCG GCACTAAAGC GGGTACACCA 
GCGGGTTCAT TAATTGCCTT GCCCAAGCCT TACGTGGTGC CGGGTGGGCG TTTTGGCGAG 
ATCTACTATT GGGATAGTTA TTTTACCATG CTCGGCTTGA AAGCATCCGG CCAGACGGCC 
CTGATTCGGA ATATGATCGA CAACTTCGCC TATCTGATCC GAACGTTCGG CTTTATTCCC 
AATGGAAACC GGACGTATTT TTTAGGCCGG TCGCAGCCCC CGTTTTTTTC ATTAATGGTC 
AACCTGCTTA GCGAAGTGCA GGGCCGTCGC GTTCTTGTTA CCTACCTGCC CGAGTTACAG 
AAAGAGTATA ATTTCTGGAT GGATGGCAGA GACCAACTGA CCGACGAACG TCCGGCTTAC 
CGACGCGTGG TGCGGCTCGA AGAAGGGGTT TACCTGAACC GATATTATGA TGATAAAATT 
ACACCACGGC CGGAGTCGTA CAGGGAGGAT GTTCAACTGG CGAAACGAAC CAAAACCCCG 
GCCATACTCT ACAAGCATAT CCGGGCCGGG GCCGAATCGG GCTGGGATTT CAGCAGCCGG 
TGGTTTCGCG ATGGAAAGAA TCTGAAGACC ATCCATACAA CAGATTTCAT TCCGGTCGAT 
TTAAATGCCC TCCTGGTCAA TTTAGAACAA ACACTTGCGG AAGGCTATCG GCTGAAGGGC 
GATAAAGTTC AGGCCAAAAA ATACACCGTC CTGGCGCAGC AACGGCGCGA CGCTATCCTA 
CGTTACTGCT GGAACGCCAA AAGCCAATTC TTTTTTGATT ACGATTTCGT TGCGGAGAAA 
CTGTCGACGG TGTACTCACT TGCCGCTGTT TATCCCCTTT TTGTTCGAAT CGCGACACCC 
TCGCAGGCGC AGGCGGTAGC TGTTACGCTG GAGAAATCGT TCCTGAAACC CGGTGGTCTA 
ACAACGACGC TTGTCCGAAC CGGCGAGCAG TGGGATGCAC CCAACGGCTG GGCGCCCTTG 
CAGTGGCTAT CCATCCGGGG CCTTCGTAAT TACAATCAGG TACAACTGGC CAACAAGGTC 
AAGACCAACT GGGTCAATGA AAATTTGCGG GTGTATAAAG CTTCCGGAAA AATGGTGGAG 
AAGTACGACG TCATCAGTAC GGCCGGAGCC AAAGGAGGGG AGTACCCCAA TCAGGACGGC 
TTCGGCTGGA CAAACGGGGT GCTCCTGACG CTGCTGACCG AAAAATAG

Protein sequence

MKLPPANRFI LLFSLLCLTP AWSQAVFEKP QSTTLNLASP DEQFGALFEA VQLKAVFPDS 
KTFADCTPKF PIATILASYE SARQRSDFDL KTFVTQNFTL PIKPASGYTS KAGQTAQEHI 
TDLWSVLTRP ASTGTKAGTP AGSLIALPKP YVVPGGRFGE IYYWDSYFTM LGLKASGQTA 
LIRNMIDNFA YLIRTFGFIP NGNRTYFLGR SQPPFFSLMV NLLSEVQGRR VLVTYLPELQ 
KEYNFWMDGR DQLTDERPAY RRVVRLEEGV YLNRYYDDKI TPRPESYRED VQLAKRTKTP 
AILYKHIRAG AESGWDFSSR WFRDGKNLKT IHTTDFIPVD LNALLVNLEQ TLAEGYRLKG 
DKVQAKKYTV LAQQRRDAIL RYCWNAKSQF FFDYDFVAEK LSTVYSLAAV YPLFVRIATP 
SQAQAVAVTL EKSFLKPGGL TTTLVRTGEQ WDAPNGWAPL QWLSIRGLRN YNQVQLANKV 
KTNWVNENLR VYKASGKMVE KYDVISTAGA KGGEYPNQDG FGWTNGVLLT LLTEK