Gene Athe_2107 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_2107
Symbol
ID	7408816
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	2234257
End bp	2235861
Gene Length	1605 bp
Protein Length	534 aa
Translation table	11
GC content	39%
IMG OID	643716473
Product	DNA polymerase III, subunits gamma and tau
Protein accession	YP_002573956
Protein GI	222530074
COG category	[L] Replication, recombination and repair
COG ID	[COG2812] DNA polymerase III, gamma/tau subunits
TIGRFAM ID	[TIGR02397] DNA polymerase III, subunit gamma and tau

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.00560473
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCACATAG CACTTTACAG GAAATATAGG CCTAAGGTGT TTGAAGATGT TGTTGCACAA 
GAGCATATAA CAAGGACTTT AAAAAATCAA ATAAAACAGG ACAAAGTAGC TCACGCATAC 
ATCTTTTGCG GCCCGAGAGG CACTGGCAAG ACAACAACTG CAAAAATAAT GTCAAGAGCT 
GTGAACTGTT TGAATCCCAA GGATGGGAAT CCGTGCAACG AATGTGAGAT ATGCAGAAGC 
ATCTTGGATG AAAAGACGCT TGATGTTTTG GAGATTGACG CTGCATCAAA CACAAGTGTC 
AACGACGTGA GGCAAATCAG GGACGAGGTC AGGTACCCAC CTTCTGTTTG CAAAAAGAAG 
GTATATATAA TAGACGAGGT GCACATGCTC TCAACAGGGG CTTTCAACGC GCTTTTAAAA 
ACCCTTGAAG AGCCCCCCTC CCATGCACTT TTTATTCTGG CAACCACAGA TATTCAAAAA 
GTACCTGCAA CCATTCTTTC AAGATGTCAG AGGTTTGATT TTAAAAGGAT TTCTGTAAAG 
GACATATATG AAAGGCTCAA AAAGATTGTT CAGATGGAAA ATATATCAAT TGACGATAAT 
GCCCTGTATT TGATCTCACA AAAGGCAGAA GGTGCTCTGA GGGATGCTTT GACCATATTA 
GAAAGGTGCA TGAATACATC TGATGAACAT ATAACCTACA AGTTTGTTGC AAACCTTTTA 
GGTGTTACAT CAACCGAGAT AGTGAAAGAA TATATTGCTG CTATTGTAGA AAATGATTCC 
AACAAAGGAC TCAAAGTTAT AAATAGGCTT TGGGATGAAG GAATGGATGT AAATACTTTT 
TTAGAAGAAG CTGTGAAGCT TTTGAGAAGT GCACTGATTT TACGACTTGG TGCAAAAGAT 
GTTTTGGTTG ACATGCTTGA AAGTGATAAA GATTTTGTCA TTAACATATC AAACCTTGTT 
GATTCAAACA GACTTGTTTC AATCATAAAG ATGCTTATTG ACACTGCCAA CCAGATACGC 
TGGACAAGAT TTCCAAAGGT TTTGCTTGAG ATAAATACAA TAAAACTTTG CGATAGCCAG 
TTTGACACCT CATTTGAAAC GCTCATTGAA AGAGTTCGAA AACTTGAGAC AAAGCTTTCT 
CAGCTTGCCG AAAATCCCAA GGCTTTTGAA GCCATGAAAC TTGACAAGGC TCAATCTACA 
AAACAAGAGC AAAAGATCTC GCATATAGCT GACAAAAGCG CAGAAGGTGT GGACAGCAAT 
GCATCTTTTT CATGGTCTGA GATTTTGAGC AGGTGGCAGG AAATAAAAGA GGCTATCAAG 
GAGGAAAAGC CGGGACTTTC GCATGTTCTT CAAAATGCCA GCCTGAGGTT AGAAAATGGT 
GTGAAGGTAT GTTTTAAGCA GGAAGATAGT GTGTTTGCAG AGGTTTTGAG CAGAAACATG 
GAGTATTTTA AGTCAATTCT AAAGAGGATT GTGGGGTATG AAGGTGAGGT CTCTGTTGAT 
GTTGAAAAGC AAGAGCCATT TAAAGAAAAT ACTGTGTCTG ACCAAGAGAT AATAAACAAG 
CTCAAGGACA TCTTCCCTGA CACAGAGATT ACTATAAAAG AGTGA

Protein sequence

MHIALYRKYR PKVFEDVVAQ EHITRTLKNQ IKQDKVAHAY IFCGPRGTGK TTTAKIMSRA 
VNCLNPKDGN PCNECEICRS ILDEKTLDVL EIDAASNTSV NDVRQIRDEV RYPPSVCKKK 
VYIIDEVHML STGAFNALLK TLEEPPSHAL FILATTDIQK VPATILSRCQ RFDFKRISVK 
DIYERLKKIV QMENISIDDN ALYLISQKAE GALRDALTIL ERCMNTSDEH ITYKFVANLL 
GVTSTEIVKE YIAAIVENDS NKGLKVINRL WDEGMDVNTF LEEAVKLLRS ALILRLGAKD 
VLVDMLESDK DFVINISNLV DSNRLVSIIK MLIDTANQIR WTRFPKVLLE INTIKLCDSQ 
FDTSFETLIE RVRKLETKLS QLAENPKAFE AMKLDKAQST KQEQKISHIA DKSAEGVDSN 
ASFSWSEILS RWQEIKEAIK EEKPGLSHVL QNASLRLENG VKVCFKQEDS VFAEVLSRNM 
EYFKSILKRI VGYEGEVSVD VEKQEPFKEN TVSDQEIINK LKDIFPDTEI TIKE