Gene Slin_5281 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Slin_5281
Symbol
ID	8729046
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Spirosoma linguale DSM 74
Kingdom	Bacteria
Replicon accession	NC_013730
Strand	+
Start bp	6438671
End bp	6440599
Gene Length	1929 bp
Protein Length	642 aa
Translation table	11
GC content	55%
IMG OID
Product	malto-oligosyltrehalose trehalohydrolase
Protein accession	YP_003390049
Protein GI	284040119
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	0.64117
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACACC TCATCGATAG CGGCCAACGC TCGCTGGGCG TCACGTTTCC CAACGAGCAC 
GAAGCCAGCA TACAGCTATG GGCACCCCTG GCCAAGTATG TAGCCATAAA AATATACGGG 
CATCCGACAG CCCTTCCTTT GACGTGCGAA GAACTGGGCT ACTGGCATTT GACAACCACC 
CAGCTTAAAC CCGGCGATCT GTACACGTTT AAGCTCGACG GGCAGGAAGA ATATCCCGAT 
CCGGTATCCC TTTGCCAGCC GCAGGGCGTA CACGGCCCCT CGCAGGCGGT CGATACAGGA 
AGCTTCTCGT GGACCGATCA GGACTGGCAA AATCCGGCGC TGGACAGCTA CGTGCTTTAC 
GAACTGCATA CCGGCACGTT TACCGAAGAA GGCACCTTTC AGTCGCTGGA GAGCAAGCTG 
GATTACCTGA AAGCGCTGGG CGTAACGGCC ATTGAGATCA TGCCAGTAGC GCAGTTTTCC 
GATTCGCGCA ACTGGGGTTA CGATGGCGTG TACACCTATG CCGTTCAGCA GTCGTACGGG 
GGAGCCAATG GCCTCCATCA CCTGGTCGAT ACCTGCCATA AAAAAGGCAT TGCGGTGGTG 
CTGGACGTAG TATACAACCA CTTCGGACCG GAAGGAAATT ACCTCGGCAA CTTCGGCCCT 
TACCTGACCG ACAAATACTG CACCCCCTGG GGAAAGGCCG TTAACTTCGA CGATGCCTGG 
TGCGATGGGG TTCGGCGGTA TGTGCTCGAA AATGCCCTGA TGTGGTTTCG GGATTTTCAC 
ATCGACGCCC TGCGGCTCGA TGCCGTTCAT GCCATCAAAG ATTTCAGCCC GGTCCATATC 
CTACAGGAAC TCCGGCAAAA AGTCGATGAA CTTATGGCCG CTACGGGTCG CCGGTACTAC 
CTCATTGTCG AGAACGACCT AAACGATCCG CGCTACATCG ACCCGCTGTC TGAGCATGGT 
TACGGCATGG ATGCCCAGTG GAACGACGAA TTTCACCACG CGCTCCGGGT AGCCGCTGGC 
GAAGAAAAAA CCGGTTACTA CGCCGACTTC GACGGGCTGA GCCACTTGGC GAAATCGTAC 
AGAGATTCTT ACGTATATGA TGGTCAGTAC TCAGCCGTTC GTAACCGGTT TTTCGGTGGC 
AAAGCCGAGA CGAATCCGGG GCAGCAATTC ATTGTCTTTT CGCAGAATCA CGACCAGGTG 
GGCAACCGCA AGTTGGGCGA GCGGTCGAGT CAGCTGTACA GCTTCGATGC GCTCAAGCTG 
CTGGCGGGCG CAGTACTGGT CAGTCCCTAC ATTCCGCTAC TATTCATGGG TGAAGAATGG 
GGCGAAACGA GTCCGTTCTT CTACTTTGTA AGCCATACGG AACCGGAGCT GGTCGAGGCC 
GTTCGGCAGG GACGCAAGGA AGAATTTGCT TCCTTTCATT CCGACGGCGA CGACGTGCCC 
GATCCGCAAA GCCACGAAAC CTACCAGCAG GCCAAACTCC AGTGGAACCT CATCGGGCAG 
AAACCGCATC AGCTACTGCT TCGCTATTAC CAGACCTTAC TTGCCCTGCG CCGACAGTTA 
CCCGCCCTGG CTCATCTGGA CCGGACCAAA CTCAACGTCA TTGACGATCT GAAGGCCGAA 
ACGCTGGTGT TGCACCGCTG GCATGACGAC CAGCATGTGC TGTGCCTGAT GAATTTTTCC 
AAACAACCCC AATCCATTGC CCTGCCAGCC GTTGGCGAGC CCAACACAAG CTGGCAAAAA 
GTACTGGACT CTGCCGATGA ACTGTGGCAA CCGGAACCCG CATCCGATCT GAGCCAGGCA 
CCCGAATCGG TAACGGGTTC CGAAACCGTT CCAGTCCGGC CCGAGTCATT TATTCTTTAC 
GCACAATCTC ATGAAAAATC CCGTTTCCAC CTACCGGATC CAATTTCACA AGGACTTTAC 
CTTTCGTGA

Protein sequence

MTHLIDSGQR SLGVTFPNEH EASIQLWAPL AKYVAIKIYG HPTALPLTCE ELGYWHLTTT 
QLKPGDLYTF KLDGQEEYPD PVSLCQPQGV HGPSQAVDTG SFSWTDQDWQ NPALDSYVLY 
ELHTGTFTEE GTFQSLESKL DYLKALGVTA IEIMPVAQFS DSRNWGYDGV YTYAVQQSYG 
GANGLHHLVD TCHKKGIAVV LDVVYNHFGP EGNYLGNFGP YLTDKYCTPW GKAVNFDDAW 
CDGVRRYVLE NALMWFRDFH IDALRLDAVH AIKDFSPVHI LQELRQKVDE LMAATGRRYY 
LIVENDLNDP RYIDPLSEHG YGMDAQWNDE FHHALRVAAG EEKTGYYADF DGLSHLAKSY 
RDSYVYDGQY SAVRNRFFGG KAETNPGQQF IVFSQNHDQV GNRKLGERSS QLYSFDALKL 
LAGAVLVSPY IPLLFMGEEW GETSPFFYFV SHTEPELVEA VRQGRKEEFA SFHSDGDDVP 
DPQSHETYQQ AKLQWNLIGQ KPHQLLLRYY QTLLALRRQL PALAHLDRTK LNVIDDLKAE 
TLVLHRWHDD QHVLCLMNFS KQPQSIALPA VGEPNTSWQK VLDSADELWQ PEPASDLSQA 
PESVTGSETV PVRPESFILY AQSHEKSRFH LPDPISQGLY LS