Gene Cthe_0668 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_0668
Symbol
ID	4810285
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	823636
End bp	824745
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	35%
IMG OID	640106084
Product	spore germination protein
Protein accession	YP_001037096
Protein GI	125973186
COG category
COG ID
TIGRFAM ID	[TIGR00912] spore germination protein (amino acid permease)

Plasmid Coverage information

Num covering plasmid clones	45
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGAAGGTA AGATAATTTT TGGAAAGAGA GAAGCAATAT CACTTCTGAT AATACTTATA 
TGCAATCAGT TAATTTTAGG ATTTCCAAGT ATTATGTCGA ATAGTGTGGG AAGTGCAGGA 
TGGATTTTGT CAATCTATGT ATCCATACTT GCATTATGCC TTTTTCTGAT AATATCAAAA 
CTTTATTCCG CTTTTGAAGG AAAAGATTTA TTGGATATAA GTGAATTCGC CGGCGGAAAT 
ATTGCAAGAA TTATCGTCGG CTTGATAGTT GTAATAGATT CGGTTCTTAT AATTTCAGTC 
AAATTAAGAG AGTATACCGA ACATATAAAA ATAATAAGCT TTACCCAATC TCCTGTCAGT 
TTTATAATGC TGTTTTTTGC TTTAGGAATG ATTATCAGTG TCCATTTTGG CATAGAACCT 
TTGGTAAGAA GTACGACAAT TGTTCTTCCG ATTGTGGCAA TCGGAGTTGT AATAGTCGTT 
GCAGGTTCTG TCAAAAATTT CGAACTTTCA AATATAATGC CGATTCTTGG CACAGGGCCT 
TATGATATTT TTGTAGGAGG CCTGCCAAGA TTGTCAATAT TTTCAGGGAT TATTTCGCTT 
TTTTTTATAC CTCCTTTCAT GGGAGGTTAC AAAAATATAA AAAAAATCGG CGTGTTGGTA 
ATTACCATAT CCGGCATAGT TTTAACCGTG GGAGTCCTTG CTTATTTGCT TGTATTCCCA 
TACCCTGTTT CTTCAAATAA TGTTCTTGCC TTTTTTGAAC TGTCAAGAGT TTTGGAATAT 
GGCAGATTTT TTCAAAGGAT TGAGTCAGTT TTTCTTCTTA CGTGGTCATT GGCAGGCCTG 
TTGTATCTTA GCTCGGGATT GTATTTTGTA ATATATGTAT TTTCAAAAAC CTTCAAGCTT 
AAATACTACA GACCGCTTAT AATTCCTTTT ACCTTGATAA TATTTTCTTT AAGCCTCATA 
CCTGAAAGTC TGATGGAGAT AATGTATCTT GACAACAAAG TAATCAGGTA TTATGCCTGG 
ATAGTTGCTT TTGGTTTGCC GTTTGTCCTT TTGTCAATTG CGAGGCTTGT TAAAAGAAAA 
AGGAGGGGTA TGGCAAAAAA TGGGAAGTAA

Protein sequence

MEGKIIFGKR EAISLLIILI CNQLILGFPS IMSNSVGSAG WILSIYVSIL ALCLFLIISK 
LYSAFEGKDL LDISEFAGGN IARIIVGLIV VIDSVLIISV KLREYTEHIK IISFTQSPVS 
FIMLFFALGM IISVHFGIEP LVRSTTIVLP IVAIGVVIVV AGSVKNFELS NIMPILGTGP 
YDIFVGGLPR LSIFSGIISL FFIPPFMGGY KNIKKIGVLV ITISGIVLTV GVLAYLLVFP 
YPVSSNNVLA FFELSRVLEY GRFFQRIESV FLLTWSLAGL LYLSSGLYFV IYVFSKTFKL 
KYYRPLIIPF TLIIFSLSLI PESLMEIMYL DNKVIRYYAW IVAFGLPFVL LSIARLVKRK 
RRGMAKNGK