Gene Cthe_1040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1040
Symbol
ID	4811334
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	1243141
End bp	1244169
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	36%
IMG OID	640106458
Product	DNA polymerase III, delta subunit
Protein accession	YP_001037465
Protein GI	125973555
COG category	[L] Replication, recombination and repair
COG ID	[COG1466] DNA polymerase III, delta subunit
TIGRFAM ID	[TIGR01128] DNA polymerase III, delta subunit

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000000000902231
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTCGGG AGAGTAAAAT GAGTATAGAT AAATTGAAAC TGGAAGTAAA AAACAAAAGT 
CTGGGAAAAC TCTATCTTTT TTACGGCGAA GAAGAATATC TGAAAAAATT TTACCTGGGC 
AAAATAGAAG AAATTATTTT AAGCAGGGAT CAAACCGGGC TGAACAAGAT AGTGATAGAG 
GGAAAGGCGG AAGCTTCAAA GATTATTGAA GCATGTGAGA CAATGCCGTT TTTCGCGGAA 
AAAAAACTGG TTGTTGTTAA AAAGTCGGAA TTGTTTAACT CAAAAAAGTC AGGCTCCTCA 
AATAATAAAA ATGATGAATT AATCACGTAT TTACAAAATA TTCCTGAACA TACCTGCCTT 
GTTTTTTATG AGGAAAATAT TGATAACAGA CTTAAAATAA CAAGTGCCGT GAAAAAATAC 
GGTATGGTGG TGGAATTTCC TTTTCAAAAG CCGGCCGAAC TTGTTAAATG GGCCATTAAA 
GTTTTCAAAT CCTACGGCAA GGCAATTGAT GAAAATACGG CATCATACCT TATAGATACA 
TGTGAGGAAG GAATGACTGA AATATTAAAT GAAATAAACA AAGTTGTTCT TTATTTGGGC 
GAAAGCCAGA AAGTTACCGT AGATAGTATA AAAAAGGTTT GCACAAAGTC AATAAAAAGC 
AGAATATTTG ATTTAATTGA CGCCATAGCC GAAAGAAAAC TTGATTTGGC TTTAAAGCTC 
TTAAATGACA TGATTATTTT AAAGGAACCC ATGCCAAAGA TTTTGTTTAT GATAGCAAAA 
CAATTAAAAC AGTTGTTGGA ATTAAAGCTT TTGTGCAGCA AGGGCATGGA TGCAAAAGAA 
GCATGTTCAA AGATGGGGAT AAATCCTTAT GCCGCGAAAA AAATGGTACG GCAGACCGAC 
TGTTTTTCTT TGGAGAAACT GAAGGAAGCA ATACGACAAG CTCTTGAGCT GGATCTTTCG 
ATAAAGACGG GGCAGATAAA CGACAGAACG GCCGTGGAAA TATTAATCTG CAGTTTGGCG 
GCTGAATAA

Protein sequence

MSRESKMSID KLKLEVKNKS LGKLYLFYGE EEYLKKFYLG KIEEIILSRD QTGLNKIVIE 
GKAEASKIIE ACETMPFFAE KKLVVVKKSE LFNSKKSGSS NNKNDELITY LQNIPEHTCL 
VFYEENIDNR LKITSAVKKY GMVVEFPFQK PAELVKWAIK VFKSYGKAID ENTASYLIDT 
CEEGMTEILN EINKVVLYLG ESQKVTVDSI KKVCTKSIKS RIFDLIDAIA ERKLDLALKL 
LNDMIILKEP MPKILFMIAK QLKQLLELKL LCSKGMDAKE ACSKMGINPY AAKKMVRQTD 
CFSLEKLKEA IRQALELDLS IKTGQINDRT AVEILICSLA AE