Gene EcolC_3349 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3349
Symbol
ID	6067406
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	3672099
End bp	3673154
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	55%
IMG OID	641602763
Product	DNA polymerase IV
Protein accession	YP_001726295
Protein GI	170021341
COG category	[L] Replication, recombination and repair
COG ID	[COG0389] Nucleotidyltransferase/DNA polymerase involved in DNA repair
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTAAAA TCATTCATGT GGATATGGAC TGCTTTTTCG CCGCAGTGGA GATGCGCGAC 
AATCCCGCCC TGCGCGATAT CCCTATTGCT ATTGGCGGCA GCCGCGAACG TCGGGGGGTG 
ATCAGCACCG CCAATTATCC CGCGCGTAAA TTTGGCGTAC GTAGCGCTAT GCCGACAGGG 
ATGGCGCTCA AATTATGCCC GCATCTCACC TTGCTTCCGG GGCGCTTTGA CGCCTACAAA 
GAAGCCTCAA ATCATATCCG CGAAATCTTC TCGCGCTACA CCTCGCGTAT TGAACCGTTG 
TCACTGGATG AGGCTTATCT CGACGTCACC GATAGCGTCC ATTGCCACGG TTCTGCGACC 
CTCATCGCCC AGGAAATCCG CCAGACGATT TTCAACGAGC TGCAACTGAC GGCGTCTGCG 
GGCGTGGCAC CCGTAAAGTT TCTCGCCAAA ATCGCCTCCG ACATGAATAA ACCCAACGGC 
CAGTTTGTGA TTACGCCGGC AGAAGTTCCG GCATTTTTAC AAACCTTACC ACTGGCAAAA 
ATCCCCGGCG TCGGCAAAGT CTCGGCGGCA AAACTGGAAG CGATGGGGCT ACGAACCTGC 
GGTGATGTAC AAAAGTGTGA TCTGGTGATG CTGCTTAAAC GCTTTGGCAA ATTTGGCCGC 
ATTTTGTGGG AGCGTAGTCA GGGGATTGAC GAGCGCGACG TTAACAGCGA ACGGTTGCGA 
AAATCCGTCG GCGTGGAACG CACGATGGCG GAAGATATCC ACCACTGGTC TGAATGTGAA 
GCGATTATCG AGCGGCTGTA TCCGGAACTT GAACGCCGTC TGGCAAAGGT AAAACCTGAT 
TTACTGATTG CCCGCCAGGG GGTGAAATTA AAGTTCGACG ATTTTCAGCA AACCACTCAG 
GAGCACGTCT GGCCGCGGCT GAATAAAGCT GACTTAATCG CCACCGCGCG TAAAACCTGG 
GATGAACGCC GCGGCGGGCG CGGTGTGCGA CTGGTGGGGC TGCATGTGAC GTTGCTTGAT 
CCGCAAATGG AAAGACAACT GGTGCTGGGA TTATGA

Protein sequence

MRKIIHVDMD CFFAAVEMRD NPALRDIPIA IGGSRERRGV ISTANYPARK FGVRSAMPTG 
MALKLCPHLT LLPGRFDAYK EASNHIREIF SRYTSRIEPL SLDEAYLDVT DSVHCHGSAT 
LIAQEIRQTI FNELQLTASA GVAPVKFLAK IASDMNKPNG QFVITPAEVP AFLQTLPLAK 
IPGVGKVSAA KLEAMGLRTC GDVQKCDLVM LLKRFGKFGR ILWERSQGID ERDVNSERLR 
KSVGVERTMA EDIHHWSECE AIIERLYPEL ERRLAKVKPD LLIARQGVKL KFDDFQQTTQ 
EHVWPRLNKA DLIATARKTW DERRGGRGVR LVGLHVTLLD PQMERQLVLG L