Gene EcE24377A_0666 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_0666
Symbol	holA
ID	5586759
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	693250
End bp	694281
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	53%
IMG OID	640924382
Product	DNA polymerase III subunit delta
Protein accession	YP_001461808
Protein GI	157155534
COG category	[L] Replication, recombination and repair
COG ID	[COG1466] DNA polymerase III, delta subunit
TIGRFAM ID	[TIGR01128] DNA polymerase III, delta subunit

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.000000205044
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTCGGT TGTACCCGGA ACAACTCCGC GCGCAGCTCA ATGAAGGGCT GCGCGCGGCG 
TATCTTTTAC TTGGTAACGA TCCTCTGTTA TTGCAGGAAA GCCAGGACGC TGTTCGTCAG 
GTAGCTGCGG CACAAGGATT CGAAGAACAC CACACTTTTT CCATTGATCC CAACACTGAC 
TGGAATGCGA TCTTTTCGTT ATGCCAGGCT ATGAGTCTGT TTGCCAGTCG ACAAACGCTA 
TTGCTGTTGT TACCAGAAAA CGGACCGAAT GGGGCGATCA ATGAACAACT TCTCACACTC 
ACCGGACTTC TGCATGACGA CCTGCTGTTG ATCGTCCGCG GTAATAAATT AAGCAAAGCG 
CAAGAAAATG CCGCCTGGTT TACTGCTCTT GCGAATCGCA GCGTGCAGGT GACCTGTCAG 
ACACCGGAGC AGGCTCAGCT TCCCCGCTGG GTTGCTGCGC GCGCAAAACA GCTCAACTTA 
GAACTGGATG ACGCGGCGAA TCAGGTGCTC TGCTACTGTT ATGAAGGTAA CCTGCTGGCG 
CTGGCTCAGG CACTGGAGCG TTTATCGCTG CTCTGGCCAG ACGGCAAATT GACATTACCG 
CGCGTTGAAC AGGCGGTGAA TGATGCCGCG CATTTCACCC CTTTTCATTG GGTTGATGCT 
TTGTTGATGG GAAAAAGTAA GCGCGCGTTG CATATTCTTC AGCAACTGCG TCTGGAAGGC 
AGCGAGCCGG TTATTTTGTT GCGCACATTA CAACGTGAAC TGTTGTTACT GGTGAACCTG 
AAACGCCAGT CTGCCCATAC GCCACTGCGT GCGTTGTTTG ATAAGCATCG GGTATGGCAG 
AACCGCCGGG GCATGATGGG CGAGGCGTTA AATCGCTTAA GCCAGCCGCA GTTACGTCAG 
GCTGTGCAAC TCCTGACACG AACGGAACTC ACCCTCAAAC AAGATTACGG TCAGTCAGTG 
TGGGCAGAGC TGGAAGGGTT ATCTCTTCTG TTGTGCCATA AACCCCTGGC GGACGTATTT 
ATCGACGGTT GA

Protein sequence

MIRLYPEQLR AQLNEGLRAA YLLLGNDPLL LQESQDAVRQ VAAAQGFEEH HTFSIDPNTD 
WNAIFSLCQA MSLFASRQTL LLLLPENGPN GAINEQLLTL TGLLHDDLLL IVRGNKLSKA 
QENAAWFTAL ANRSVQVTCQ TPEQAQLPRW VAARAKQLNL ELDDAANQVL CYCYEGNLLA 
LAQALERLSL LWPDGKLTLP RVEQAVNDAA HFTPFHWVDA LLMGKSKRAL HILQQLRLEG 
SEPVILLRTL QRELLLLVNL KRQSAHTPLR ALFDKHRVWQ NRRGMMGEAL NRLSQPQLRQ 
AVQLLTRTEL TLKQDYGQSV WAELEGLSLL LCHKPLADVF IDG