Gene Cthe_2064 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_2064
Symbol
ID	4810662
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	2455560
End bp	2456831
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	38%
IMG OID	640107471
Product	spore germination B3 GerAC like
Protein accession	YP_001038464
Protein GI	125974554
COG category
COG ID
TIGRFAM ID	[TIGR02887] germination protein, Ger(x)C family

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0147375
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGGTTAA AAAATAAAAA AACAGCAAAA ATGTTAATTA CAGTTTTGAT TATAATACCA 
AGCCTGACCA TTTTGCTTAC CGGGTGCTGG GATTCCATAG ACATAGAAGA CCGTGCGTAT 
GTAATCGGCA TTGCCATTGA CGAGTACCCT CAACTTCCTC AAGGCATCAA AAATAAAGAA 
AACATTCCAG AAAATGAACA GGAAAGAATG TTTGAATCCA GTACGGAAGT TGACACGGGA 
GTTCCTTCTT ATGCCATGAC CATACAAATT CCTATTATAA AACATGCCTC ACTCCCCAAC 
ATTTTGTCCG GAGGAACTTC AGAGCCCAAT ACGCTGAAAA CCTGGGACAT CACCCAGGTG 
GGCAACTCGT TTATGGAAAT AAACAGATCC ATTACAACAA GAATGAACTT GATACCCAAT 
TACGAACATC TTCAGGTTAT CATTATCTCG GAAAAAGTTG CAAGAAAAGG CCTTAGAAAT 
GTTCTTGACC TTTTTATAAG GGATCATGAA ATGAGAAGCA GGACAAAATT GTTCATAACT 
GACGGAGATG CAAAAAAGGC CCTTGATGTC ATTCCAAGAA TTGAAGACTA TGCTTCAATA 
TATCTTACCA AAATGCCAAG AAGTGCCAGA GTAAACGGAG AAATACTGCA CTGGATGGAT 
CTCGGTCAGG CCGTTCAGGC CATCTATTCC GGTGAGGACT TCGAACTTCC GGCTTTGGAA 
GTAACCGAGT ACGAGGTAAT GAACAAAGGC GCAGCTTTGT TTAAAAATGA CAAAATGGTC 
GGATGGGCTG ACGGCAAAGA TGTGGAAATT ATTAAAATCA TGCATAATGT GCTTTTAGGC 
GGCATCTTTA CTTCAAAATT TGTTTCAGAT GAACATGATT CCGAAAATGG CGTAATGAGC 
CTTGAAATAA TCAAATCAAA GACCAAAATC ACACCCGTAA TCCAGGACGA TGATATAACT 
TTCAAAATAA ATGTGGACAT TAAAGGGAAT TATTCGGATA GTGTAAATCA TCCTCTCACC 
GAAAAAATTG ACAAAGATTT TATAGAAAAA GCTGAAGAAG CCTTTGAGGA GTCAATAAAA 
GAACAGTGTA TCAAAACAAT TAAAAAAATG CAGGACCTGG GTGTGGATAC TTTTCATTTT 
GGAACCGTTA TAAGAAGCAA GAAGCCCTCC CATTGGTCAA AAATTAAAGA CAGATGGGAC 
GAAATTTTTC CTGAAGTTAA AACTGAAGTA AATGTAAAGG TAAATATAAG GCAAATAGGA 
AACATCCACT AA

Protein sequence

MRLKNKKTAK MLITVLIIIP SLTILLTGCW DSIDIEDRAY VIGIAIDEYP QLPQGIKNKE 
NIPENEQERM FESSTEVDTG VPSYAMTIQI PIIKHASLPN ILSGGTSEPN TLKTWDITQV 
GNSFMEINRS ITTRMNLIPN YEHLQVIIIS EKVARKGLRN VLDLFIRDHE MRSRTKLFIT 
DGDAKKALDV IPRIEDYASI YLTKMPRSAR VNGEILHWMD LGQAVQAIYS GEDFELPALE 
VTEYEVMNKG AALFKNDKMV GWADGKDVEI IKIMHNVLLG GIFTSKFVSD EHDSENGVMS 
LEIIKSKTKI TPVIQDDDIT FKINVDIKGN YSDSVNHPLT EKIDKDFIEK AEEAFEESIK 
EQCIKTIKKM QDLGVDTFHF GTVIRSKKPS HWSKIKDRWD EIFPEVKTEV NVKVNIRQIG 
NIH