Gene Sterm_1031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sterm_1031
Symbol
ID	8596510
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sebaldella termitidis ATCC 33386
Kingdom	Bacteria
Replicon accession	NC_013517
Strand	+
Start bp	1115745
End bp	1117406
Gene Length	1662 bp
Protein Length	553 aa
Translation table	11
GC content	43%
IMG OID
Product	Glycerol dehydratase
Protein accession	YP_003307830
Protein GI	269119653
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.00671582
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGTCAA AAAGATTTGA AGTCCTAAGA AACAGACCGG TAAATCAGGA TGGATTCGTT 
GCTGAATGGC CGGAGGTAGG ATTTATCGCT ATGAACGGAC CAAATGATCC CAAGCCCGGA 
GTAAAGGTGC AAAATGGCGA AATAGTAGAG CTGGACGGTA AAAGGAAAGA AGATTTTGAT 
TCGATAGATA TGTTTATAGC AAAATATTCG ATTAATATAG AAAAAGCAGA GGAAGTAATG 
AAAATGGATT CACAGAAGCT GGCAAACATG CTTTGTGATC CTAATGTGCC CCGTACTAAG 
CTGATAGAGA TAACTACTGC CATGACTCCG GGGAAAATAG TAGAAGTTTT GGGACATATG 
AATGTACTGG AAATGATGAT GGCGCTTCAA AAAATGCGTG CCAGAAAAAC ACCGGCAAAT 
CAGTGTCATG TTACCAGTGT AAAGGATAAT CCCGTTCAGA TTGCTGCAGA AGCAGCAGAA 
GCAGCAGTAA GAGGATTTGC CGAGGAAGAA ACTACAGTGG GAATAGCAAG ATACGCTCCT 
TTTAATGCTC TTGGACTGCT TATAGGTTCT CAGGTGGGAA GAGGAGGAAT TCTCACACAG 
TGTGCCCTTG AAGAAGCAAC GGAACTTCTT CTGGGAATGA GAGGACTTAC TTCATATGCA 
GAGACAATTT CTGTTTACGG AACAGAAGAT GTCTTTACAG ACGGTGACGA CACTCCGTGG 
TCGAAGTCGT TTCTGGCATC TGCGTATGCG TCAAGAGGAT TAAAAATGAG ATTTACTTCC 
GGGACAGGTT CAGAGGTTCA GATGGGATAT GCCGAAGGAA AGTCAATGCT TTATCTTGAG 
GCAAGATGTA TATATATAAC AAAAGGTGCA GGGGTACAGG GACTGCAGAA CGGTTCCATA 
AGCTGTATCG GGATACCCGG GGCAGTACCT TCGGGAATAC GTGCCGTGCT TGCGGAAAAC 
CTTATAACAA CAATGCTTGA TCTGGAAGTA GCTTCCGGGA ATGACCAGAC TTTCTCGCAT 
TCGGATATAA GAAGAACTGC GAGAATGCTT ATGCAGATGG TTCCGGGGAC AGATTTTATC 
TTTTCGGGAT ACAGTGCGAC CCCTAATTAT GATAATATGT TTGCCGGGTC AAATTTTGAT 
GCTGAGGATT TTGATGATTA TAATATTATA CAAAGAGATC TGAAAGTAGA CGGGGGTCTT 
CGTCCTGTAG TGGAAGACGA AATTGTGGCA ATCAGAAATA AGGCTGCAAG AGTACTTCAG 
GCTGTATTCA GAGAACTGGG TCTTCCGGAA ATTACTGATG AAGAGGTAAC AGCAGCTACC 
TATGCACATG GAAGCAAGGA TATGCCTGAC AGAAATGTGG TGGAAGATCT GAAAGCAGCA 
GGAGAAATGC TGACAAGAGG TATAACCGGA GTGGATGTAG TAAAAGCTCT TCATAAAAAT 
GGATATCTGG ATGTAGCACA AAATGTGCTG AATATGCTGA AACAGAGAGT TTCCGGGGAT 
TATCTTCATA CATCGGCAAT TATAAACAAG GATTTTGAAG TAATAAGTGC CGTGAATGAT 
CTGAACGACT ATTCCGGACC GGGAACCGGG TACAGAATAA GCGAAGAGCG TTGGAATGAG 
ATAAAAGATA TTCCAAATGC AATAAAACCT GATTCAATAT AG

Protein sequence

MKSKRFEVLR NRPVNQDGFV AEWPEVGFIA MNGPNDPKPG VKVQNGEIVE LDGKRKEDFD 
SIDMFIAKYS INIEKAEEVM KMDSQKLANM LCDPNVPRTK LIEITTAMTP GKIVEVLGHM 
NVLEMMMALQ KMRARKTPAN QCHVTSVKDN PVQIAAEAAE AAVRGFAEEE TTVGIARYAP 
FNALGLLIGS QVGRGGILTQ CALEEATELL LGMRGLTSYA ETISVYGTED VFTDGDDTPW 
SKSFLASAYA SRGLKMRFTS GTGSEVQMGY AEGKSMLYLE ARCIYITKGA GVQGLQNGSI 
SCIGIPGAVP SGIRAVLAEN LITTMLDLEV ASGNDQTFSH SDIRRTARML MQMVPGTDFI 
FSGYSATPNY DNMFAGSNFD AEDFDDYNII QRDLKVDGGL RPVVEDEIVA IRNKAARVLQ 
AVFRELGLPE ITDEEVTAAT YAHGSKDMPD RNVVEDLKAA GEMLTRGITG VDVVKALHKN 
GYLDVAQNVL NMLKQRVSGD YLHTSAIINK DFEVISAVND LNDYSGPGTG YRISEERWNE 
IKDIPNAIKP DSI