Gene Cthe_1058 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1058
Symbol	glyA
ID	4811356
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	1264583
End bp	1265821
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	43%
IMG OID	640106480
Product	serine hydroxymethyltransferase
Protein accession	YP_001037483
Protein GI	125973573
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0112] Glycine/serine hydroxymethyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.00108739
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTAATT TGAATGAAAT ATCAAAAATC GATCCCGAAG TTGCGAAGGC AATTGAATTG 
GAGGTTAATC GTCAGAGAAA CAAGATAGAG CTTATTGCAT CTGAAAATTT TGTCAGTAAA 
GCCGTAATAG AAGCAATGGG TACACCTCTG ACCAACAAGT ATGCTGAAGG ATATCCGGGA 
AAAAGGTATT ACGGAGGCTG TGAGTTTGTT GACATAATTG AAAATCTTGC GATTGAACGG 
GCAAAGAAAA TATTCGGAGC TGAGCATGCG AATGTGCAGC CGCATTCAGG GGCTCAGGCA 
AATATGGCTG TGTTTTTTGC AGTGTTAAAT CCCGGAGATA CGATTCTTGG AATGAATCTT 
TCCCATGGAG GGCATTTGAG CCATGGAAGC CCTGTCAACA TGTCCGGAAA ATATTATAAT 
GTCATATCCT ACGGAGTAAG GAAGGAAGAC TGCAGAATAG ACTATGACGA AGTGAGAAAG 
CTTGCAAAGG AACACAGGCC GAAACTTATA GTGGCGGGAG CCAGTGCATA TCCAAGAATA 
ATAGATTTTA AGGCTTTCAG AGATATTGCG GATGAAGTCG GAGCATATTT GATGGTGGAT 
ATTGCACATA TAGCAGGTCT TGTTGCAGCA GGACTGCACC CGAATCCTGT TCCTTATGCA 
CATTTTGTTA CCACCACCAC TCACAAGACT TTGAGAGGTC CGAGAGGCGG ACTGATATTG 
TGCGGCAATG AGCATGCAAA AATGATTGAC AAGGCTGTTT TCCCGGGAAT ACAGGGCGGT 
CCTCTGATGC ATGTTATTGC GGCAAAAGCG GTAAGCTTTG CCGAAGTATT GACCGATGAA 
TTCAAGCAGT ATCAGCAGCA GATAGTAAAA AATGCGAAAA CTCTTGCCAA CGCTTTGATG 
GAGAAAGGCA TTGACCTTGT TTCCGGTGGA ACGGACAACC ATCTCATGCT GGTTGATTTA 
AGAAATAAAG GTCTTACGGG TAAATACGTT CAGCATATTC TTGATGAGGT TTGCATTACC 
GTAAATAAAA ACGGAATTCC TTTTGACCCT GAAAGTCCGT TTGTTACCAG CGGTATCAGA 
ATAGGAACAC CTGCGGTGAC GGCACGGGGT ATGAAAGAAG AGGATATGGT TGAGATAGCG 
GATCTTATCA ATCTCACCAT TACGGATTAT GAGAATTCGA AAGAGAAAGT AAAGGAAAGA 
GTAAGAATGC TATGCGAAAA ATATCCTTTG TATCAGTAA

Protein sequence

MFNLNEISKI DPEVAKAIEL EVNRQRNKIE LIASENFVSK AVIEAMGTPL TNKYAEGYPG 
KRYYGGCEFV DIIENLAIER AKKIFGAEHA NVQPHSGAQA NMAVFFAVLN PGDTILGMNL 
SHGGHLSHGS PVNMSGKYYN VISYGVRKED CRIDYDEVRK LAKEHRPKLI VAGASAYPRI 
IDFKAFRDIA DEVGAYLMVD IAHIAGLVAA GLHPNPVPYA HFVTTTTHKT LRGPRGGLIL 
CGNEHAKMID KAVFPGIQGG PLMHVIAAKA VSFAEVLTDE FKQYQQQIVK NAKTLANALM 
EKGIDLVSGG TDNHLMLVDL RNKGLTGKYV QHILDEVCIT VNKNGIPFDP ESPFVTSGIR 
IGTPAVTARG MKEEDMVEIA DLINLTITDY ENSKEKVKER VRMLCEKYPL YQ