Gene Cthe_1340 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1340
Symbol
ID	4809480
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	1630913
End bp	1632040
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	40%
IMG OID	640106764
Product	hypothetical protein
Protein accession	YP_001037765
Protein GI	125973855
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGGTAA TTCATCTTGT AATCGCTGAC AAGGATAGGG CTTATCTTGA CAGTTTGGTT 
GACTTCATTT ATTCAAAATA TAACAACAGA TTTTATGTTC AGGCTTTTTC CAACGAGGAT 
ACTTTTAACG ACTTTTTTAA TAAAACGGAC AAAATTGACA TACTTCTTAT AAGTCCGGAC 
TTTTACAGTG ATGAGCTTGA TTTGGAGAAG GTAGTTGCAC CCATTGTGTT GTCGGCCGGA 
ATTCTCACGA AAGATATAAA AAACTGTGAG ATAATCAGTA AATATCAAAT GGGCGACAAG 
CTTGTCGGCA ATATATTAAA TATTTTTTCC GAGAAAAGCA ATTGCGAGTT TATAACCGGT 
GACGGAAAAA AGAAGACTCG TTTTGTCACT TTTTATTCTC CATGCGGAGG GGCGGGTACA 
TCCACCTTGG CCGCAGGTGT GAGCGTCAAA TGTGTACAGA GCGGATTGAA CGCTTTTTAT 
CTTAATTTCG AAAAAATTGC CGCTACTACC GCTTATTTTG ATGCCCATGG CAGTGGAGAA 
AATCTTTCGA ATGTTTTGTT TTTCCTCAAG GAGAATAATA AAAACCTGGC GCTTAAAATA 
GAAGGAAGCA GATCCATAGA CAGCACAACG GGAGTTCATT ATTTTTTACC CCCGGAGAAC 
GTTTTTGACC TTGATGAGTT GACATCCGAT GAGATAAAGA GGCTTATAGG ACAGTTTAAG 
GCGATGGAGA GCTATGATGT GGTTATAGCT GATACAGGTT CGGAGTTAAA CAATGTCAGT 
ATATCGCTTC TGGAAAGCAG TGATTTGGTG TTCTGTGTTT TGCCTTGTGA TACTACGGCA 
AAGATTAAGC TGGCAACACT CCATAAAGCC TTTGATATTC TTAACAAGAG AAAAGGCTTG 
AACTTTGAGG ACAAGATGGA GCTTATACTG AACAAATGCC TGAACTTGGG ATCTTCTGAT 
GTTGAAAGTC TTACTTTGAA CGGAAAACCT GCTTCTGTCA GGATACCTTA CATAAAAGGA 
CTGGATGCAA GCTATGGCAT AGAGCACCTG ACAGAAGATT CCAACCCTCT TGGACAGGCT 
GTAAGGCAAA TAATTAGCAT ATTGCAGGGA AGTACGGGTG GTTGCTGA

Protein sequence

MAVIHLVIAD KDRAYLDSLV DFIYSKYNNR FYVQAFSNED TFNDFFNKTD KIDILLISPD 
FYSDELDLEK VVAPIVLSAG ILTKDIKNCE IISKYQMGDK LVGNILNIFS EKSNCEFITG 
DGKKKTRFVT FYSPCGGAGT STLAAGVSVK CVQSGLNAFY LNFEKIAATT AYFDAHGSGE 
NLSNVLFFLK ENNKNLALKI EGSRSIDSTT GVHYFLPPEN VFDLDELTSD EIKRLIGQFK 
AMESYDVVIA DTGSELNNVS ISLLESSDLV FCVLPCDTTA KIKLATLHKA FDILNKRKGL 
NFEDKMELIL NKCLNLGSSD VESLTLNGKP ASVRIPYIKG LDASYGIEHL TEDSNPLGQA 
VRQIISILQG STGGC