Gene Cthe_2018 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_2018
Symbol
ID	4810988
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	2396459
End bp	2397694
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	36%
IMG OID	640107428
Product	hypothetical protein
Protein accession	YP_001038423
Protein GI	125974513
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0359073
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAGATC CGTTGTGTGA TGAAAGTTAT TTGTTGAAAA CAATAGAGTC TAACCGAAAG 
TTCATTTCTA AAAGGAAAGA AAAGATTATT GGATTAAAAG CTGATATAGA GAATGGTATA 
CAAAGATATC CAAGAGATAA CCAAAGTATA ATTTATATTA CGTTTTCTCA AATGTTTATG 
TATGGCATGA ATATGCTTTT AGCAAAATAT TCCTTGGGCA ATCACCCTGA TACAATGATA 
GATGACTATT TAGACAACAT AACATATTTA GAGAATTGCG GTGAAGAAGA GGCCGGCTAC 
ATTAACCTTT TATGGATGGT TGGACTGGGT ATCCTTTTGG AAATGGATAA AGAAGTGTTA 
AAAAGACTGG CAAGAGTTAT AGAAAGGCAA AGAATAGAAG ACGCACTTAT GGATTTTTTA 
TTGAAAGCTT GTGATATAGG TTGGAACCAC AGTACAACGA AATATGAAAA AAAGAACCCG 
TATGAAAAGA CAGTAGAGAT TATAAAAATA GCATTACACG ACAAAGACAA GGAAGCGGCA 
TCTAAAAGGC TTGAAAAATA TATGGAAAAA GAATGGTTCA AGGGACATTA CGACTTTGGG 
TGGAGGAATG CCCATAAGGA ACCTGGCTAT TATGGTTTTT GGAGTTTTGA TACAGCGGCA 
CTGGCCAAGA TACTGGGGCT GGACGACAGT GCGTTAAAAG ACAACAACCA TTATCCTTAT 
GATTTGGCAC ACTATAAGAA TGGAATGACC TTTGATTTAA GTTGGTATAG TGAACCAAGG 
GAAGAGGAAG TCCGGGAAGA AACGGTGGTA TATGGTATAC CGGGTAATCC TTTGTTGGAG 
AGGATAATAC CTGGGAGATT CCACAGTTTT GTAAATGAGA TAATAAATGA TTATAAAACA 
CTGCCGGACG AAGAGTTTTG GAAGAAGTAT AATTTGAAAG AAATATGGTT TGATGTAGAG 
GAGTATAAGG AGGATAATAA AGATAAGAAT TTGTTGGGTA CGATTATAGT GTTCATGCTT 
GTGGACAAAG ATTATATTTT GCAGTTGGAT TATAAAGAAG AGTTAATAGA CTATATAGAG 
AATATACATA ATTACTGGCC CAAGGAAGAA GTTAAGCTTA TAAGCTTTGA ATTAGACAAT 
GACCAACAGT ACTATGCGTA TGTACCGAAG GATGCGGAGG CTGGTTCGTT GTATGAGGTA 
AAAGTGACAG AAGTGGAGAA AATAGAGGAG GTTTAG

Protein sequence

MRDPLCDESY LLKTIESNRK FISKRKEKII GLKADIENGI QRYPRDNQSI IYITFSQMFM 
YGMNMLLAKY SLGNHPDTMI DDYLDNITYL ENCGEEEAGY INLLWMVGLG ILLEMDKEVL 
KRLARVIERQ RIEDALMDFL LKACDIGWNH STTKYEKKNP YEKTVEIIKI ALHDKDKEAA 
SKRLEKYMEK EWFKGHYDFG WRNAHKEPGY YGFWSFDTAA LAKILGLDDS ALKDNNHYPY 
DLAHYKNGMT FDLSWYSEPR EEEVREETVV YGIPGNPLLE RIIPGRFHSF VNEIINDYKT 
LPDEEFWKKY NLKEIWFDVE EYKEDNKDKN LLGTIIVFML VDKDYILQLD YKEELIDYIE 
NIHNYWPKEE VKLISFELDN DQQYYAYVPK DAEAGSLYEV KVTEVEKIEE V