Gene Cthe_1910 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1910
Symbol
ID	4810768
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	2271729
End bp	2272976
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	32%
IMG OID	640107327
Product	hypothetical protein
Protein accession	YP_001038322
Protein GI	125974412
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000000707151
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGATGA AAAAAAGCGA CTTGAGTCTT AGAGAAGTTC TGGAAGTAAT ATTTAGTGTT 
GCCAATAAGA GGGCCGGTTT TTTTGCTGAT AGTTATCTAT TTAAAGACCC ATCTATCATT 
TCCAAATGGA AGATCGGAAG AGCATTGCCC AGTAATGATG ACATTGAAAA GATTGTTACC 
TTTACAGTAA ATGAGATGAC AGGAAACCAG CATAAGATAC TTAGAAGCGC TCTCGAAGAT 
TTAATTCGAA ATTCCATTAT TGACAAAGAT ATCACTATTG ACAATGAAAT TAAAGAATCA 
TTGTTAAGCA TAGAAGATTT TAAGAATTTT CTGTCGGAAG TATTGAGGAT TGCCAAAACT 
GTTAACCGCA GCAACAAGCA AATCAATGAC AAATTTAGTG GCAATTTATG TGGTATCAGT 
GGGACTGATG AAAAAGAAGG GTCTGACAGT AGTGGTAAAA ATATAGTTCT TGACAACGCT 
GTTATTGTAT CCTCAGAAGA TATGGAAGGA ACATATTCCG GAATAGTTGA GTTTAATATG 
CGGCTTTTAA AAAAGAAGGA TAGAAGCCTT AAGAATACGG AAAGTCCGGA CATACATATC 
AACAGGAATG AGAATTATAT TGCAACAGAC AAAGCTGGTA AAGTGAAAGG ACGTATTACT 
GCAAAAAGCT TGATTGGTAC TGTTATTGTA GGGATTATTT CAAGTTTGTG TGTTATTCAA 
ATGGTAAACA GCTTGAAATT AACAGATAAA GTGCCGGAAG TATATGCCGT GGAGAGTTTG 
GCAAAAGAAT TTTCATCTTT GGACAACTTA AATCCGAAAT TGGAAGTAAT AAAACAAAAT 
AATTATGATA ACTCAAATCA GAAAGAGAGT ACTGTCAAAG AAAATAATGA ATCAGATGTT 
TGTTTTAGCA ATGATAATGT CATAGAGGAA AACAAAGGAG AAGATGAAGG AAAAAATAAA 
AATATAGAAG AAAGCAAAAG AGAAAATGAA AGTGAGAGCA AAGAGAAAAA AGAAGAAAGT 
GAAAAGAAAA ATAAAGACAA AAACAAAGAG GAAAATAAAG AAGAAAAGAA AGAGGCTGTC 
AGTGAAGCAA ACCAGTATAT AAAGGACAAT ACAATAGACA ATTCGACAGT TGTTGATGTC 
AATAATGGTT TAATAAACAG TTCAATAGTT ATTAATGGCG ATAACAACAA CATAATTAAT 
GGACATAATA TATTTTTCAA TTATGAAAAT AAGAGCGATT CAAATTGA

Protein sequence

MKMKKSDLSL REVLEVIFSV ANKRAGFFAD SYLFKDPSII SKWKIGRALP SNDDIEKIVT 
FTVNEMTGNQ HKILRSALED LIRNSIIDKD ITIDNEIKES LLSIEDFKNF LSEVLRIAKT 
VNRSNKQIND KFSGNLCGIS GTDEKEGSDS SGKNIVLDNA VIVSSEDMEG TYSGIVEFNM 
RLLKKKDRSL KNTESPDIHI NRNENYIATD KAGKVKGRIT AKSLIGTVIV GIISSLCVIQ 
MVNSLKLTDK VPEVYAVESL AKEFSSLDNL NPKLEVIKQN NYDNSNQKES TVKENNESDV 
CFSNDNVIEE NKGEDEGKNK NIEESKRENE SESKEKKEES EKKNKDKNKE ENKEEKKEAV 
SEANQYIKDN TIDNSTVVDV NNGLINSSIV INGDNNNIIN GHNIFFNYEN KSDSN