Gene Cthe_1364 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1364
Symbol
ID	4809359
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	1657460
End bp	1658638
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	35%
IMG OID	640106788
Product	hypothetical protein
Protein accession	YP_001037789
Protein GI	125973879
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2755] Lysophospholipase L1 and related esterases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.0000000024275
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTGGAAAA ACGCAATTTA TCTCTTTAGT TCAATTCTGA TTGCAAGCCT GGTTATACTT 
ATATCCGGGA GATACCTCGA TGGGATAAGC GGGTCTTACT TGGGAGAACA AAAACAACGG 
CTCGAAGTTC AGACAGAGTA TCAAACTGAG CTTGAAAAAG TCCAGGCAGG GAATGTGTAC 
GAAAAGCTTG TGAATAAAAA AGAAATCAGT GTTTTGATTA TTGGAGACGA TATTGCTCAA 
GGAGGTTTGG AAACCGAGGA CGAAAAGAAA TGGTATAATC TTTTGGCGAA AAGAATAAAA 
GAGGAGTATG GAGCTGATTT AACTTGTAAA AATATTGCAA CACCCGGTGG AACAGCATTT 
GATGGATGGA TTGACTATAT TACCGACAGA GAAAGGCAAG AGTATGATCT TGTATTTTTA 
TGTTTTGGTG CAAACGACGA AAGAGAGATG AATTTCAATC AAAAAGTTTT CGGCGCTATT 
GTGGAAGGAT TGATTAGAAA TATAAAGAAA GCAAAAGCGA GTACGGAAAT AATCACGATT 
ATTGAGAACA GTATAAGGAG CCAGTCATAT GTGGATACTC TAAAGCAAGT ATCGGAATAT 
TACGAAATAA CTTATGCAGA CATAATAAAA GCTTTTATAG ACTCACGGCT GCCGTTTAAT 
GATATCACTG AGGATGGCAG AAAACCAAAT GAACAAGGTT ACTCAATTTA CGTCAATACA 
ATATTTGATT TAATCAAGTC GAATATTAAC AGCAAAAGAG AACCTGGTTT TGATGGGAAA 
AAACCGTTAC TTTATGAGGA AAGCAATGCT TTTGAGAACG GAAAAATTAC AACGGAATTT 
TTGACAATTC AAGGTTTTTA TAACAGTGTG GTTGCTTTTG ACAAGATTTT TATGAAGAGT 
AGTCACAGTA ATGACTCTAT AACATATGAA GTAAGCAACA GCCATATGCT GGGAGTAACA 
TTGATGGCGG GTCCTAATTG TGGAATTGTG GATATATATC TAAATAACAG ATTGATTCAA 
ACCTATGATT GTTATGCACC ATACGAAGCT TTGAGGCATG TGTTGATAAG TGATAATATT 
GGAATGGGGA CTCATAAAAT AAGAATTGAA GTGTCAAGTA TAAAAAATGC CAAAGCAAGC 
AATTCAAATG TTTATATTCA CGGGATAATA ACTAACTAA

Protein sequence

MWKNAIYLFS SILIASLVIL ISGRYLDGIS GSYLGEQKQR LEVQTEYQTE LEKVQAGNVY 
EKLVNKKEIS VLIIGDDIAQ GGLETEDEKK WYNLLAKRIK EEYGADLTCK NIATPGGTAF 
DGWIDYITDR ERQEYDLVFL CFGANDEREM NFNQKVFGAI VEGLIRNIKK AKASTEIITI 
IENSIRSQSY VDTLKQVSEY YEITYADIIK AFIDSRLPFN DITEDGRKPN EQGYSIYVNT 
IFDLIKSNIN SKREPGFDGK KPLLYEESNA FENGKITTEF LTIQGFYNSV VAFDKIFMKS 
SHSNDSITYE VSNSHMLGVT LMAGPNCGIV DIYLNNRLIQ TYDCYAPYEA LRHVLISDNI 
GMGTHKIRIE VSSIKNAKAS NSNVYIHGII TN