Gene EcolC_3005 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3005
Symbol	holA
ID	6065950
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	3285629
End bp	3286660
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	53%
IMG OID	641602422
Product	DNA polymerase III subunit delta
Protein accession	YP_001725957
Protein GI	170021003
COG category	[L] Replication, recombination and repair
COG ID	[COG1466] DNA polymerase III, delta subunit
TIGRFAM ID	[TIGR01128] DNA polymerase III, delta subunit

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.00124747
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTCGGT TGTACCCGGA ACAACTCCGC GCGCAGCTCA ATGAAGGGCT GCGCGCGGCG 
TATCTTTTAC TTGGTAACGA TCCTCTGTTA TTGCAGGAAA GCCAGGACGC TGTTCGTCAG 
GTAGCTGCGG CACAAGGATT CGAAGAACAC CACACTTTTT CCATTGATCC CAACACTGAC 
TGGAATGCGA TCTTTTCGTT ATGCCAGGCC ATGAGTCTGT TTGCCAGTCG ACAAACGCTA 
TTGCTGTTGT TACCAGAAAA CGGACCAAAT GCGGCGATCA ATGAACACCT CCTCACGCTC 
ACCGGATTGC TGCATGACGA TCTGCTGTTG ATCGTCCGCG GTAATAAATT AAGCAAAGCG 
CAAGAAAATG CCGCCTGGTT TACTGCTCTT GCGAATCGCA GCGTGCAGGT GACCTGTCAG 
ACACCGGAGC AGGCTCAGCT TCCCCGCTGG GTTGCTGCGC GCGCAAAACA GCTCAACTTA 
GAACTGGATG ACGCGGCAAA TCAGGTGCTC TGCTACTGTT ATGAAGGTAA CCTGCTGGCG 
CTGGCTCAGG CACTGGAGCG TTTATCGCTG CTCTGGCCAG ACGGCAAATT GACATTACCG 
CGCGTTGAAC AGGCGGTGAA TGATGCCGCG CATTTCACCC CTTTTCATTG GGTTGATGCT 
TTGTTGATGG GAAAAAGTAA GCGCGCGTTG CATATTCTTC AGCAACTGCG TCTGGAAGGC 
AGCGAGCCGG TTATTTTGTT GCGCACATTA CAACGTGAAC TGTTGTTACT GGTTAACCTG 
AAACGCCAGT CTGCCCATAC GCCACTGCGT GCGTTGTTTG ATAAGCATCG GGTATGGCAG 
AACCGCCGGG GCATGATGGG CGAGGCGTTA AATCGCTTAA GTCAGCCGCA GTTACGTCAG 
GCCGTGCAAC TCCTGACACG AACGGAACTC ACCCTCAAAC AAGATTACGG TCAGTCAGTG 
TGGGCAGAGC TGGAAGGGTT ATCTCTTCTG TTGTGCCATA AACCCCTGGC GGACGTATTT 
ATCGACGGTT GA

Protein sequence

MIRLYPEQLR AQLNEGLRAA YLLLGNDPLL LQESQDAVRQ VAAAQGFEEH HTFSIDPNTD 
WNAIFSLCQA MSLFASRQTL LLLLPENGPN AAINEHLLTL TGLLHDDLLL IVRGNKLSKA 
QENAAWFTAL ANRSVQVTCQ TPEQAQLPRW VAARAKQLNL ELDDAANQVL CYCYEGNLLA 
LAQALERLSL LWPDGKLTLP RVEQAVNDAA HFTPFHWVDA LLMGKSKRAL HILQQLRLEG 
SEPVILLRTL QRELLLLVNL KRQSAHTPLR ALFDKHRVWQ NRRGMMGEAL NRLSQPQLRQ 
AVQLLTRTEL TLKQDYGQSV WAELEGLSLL LCHKPLADVF IDG