Gene P9303_19021 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_19021
Symbol	dnaQ
ID	4776092
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	+
Start bp	1662829
End bp	1663794
Gene Length	966 bp
Protein Length	321 aa
Translation table	11
GC content	52%
IMG OID	640087411
Product	putative DNA polymerase III, epsilon subunit
Protein accession	YP_001017909
Protein GI	124023602
COG category	[L] Replication, recombination and repair
COG ID	[COG0847] DNA polymerase III, epsilon subunit and related 3'-5' exonucleases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.182153
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTGCGG GAGAATACAA GCAATCGATC GATGAACACG GCGTGGGGGA AGCAAAGCAG 
CATCTCTTTG GAGCTGGTCA GTTAGATCTT CTCCCCGATC TCAATGCAGA AGAGGCAGTT 
GTCACTCCTT CAAAGGCTGT CTCTACCTCA AAGGCTGTCT CTACCTCAAA GGCTGTCTCT 
ACTTCAAAGG CTGTCTCTTT ACCGCAACCT CATGCACCAG TGGCACTGCC TTCATTGCAT 
CGAGAAGCTT TGAGCTCACT GCCAGAGATG CTGCTGATCA TCGATACGGA AACCACTGGA 
TTGGATCCGA AGCGAGGTCA ATGCCTAGAG GTTGGAGCCA TCCTTTTCCA TGCACCGCAG 
CGTGCTGTGC TTGCCCAGCA TTCCTTTTTG CTACCTGTGG AAACCAATGC GGCTGAATCA 
ATCAATCGCA TCCCCGCTGA GGTCACTCGC TTGGATCAGC CTTGGCGACA AGGGCTGGAC 
TATTTCCAAG CCTTACTGGA TGCCGCTGAT CTGTTAGTTG CTCACAATGC TGGCTTCGAT 
CGTCAGTGGT TCGGGAAGGA TCAACTTCCA GCTGTCTCCA AGCCCTGGCT GTGCACGATG 
GAAGACATCG CTTGGCCAGT TGATCGTCAG CTTCGTTCCA GGCCTTCTGT AAGAGATTTA 
GCTCTCGCTT ATGGCGTGCC GGTATGGGCC GCACATCGTG CTCTCACCGA CTGCATTTAT 
CTCGCCGAGG TGTTCGCCCG TTGCAAGGAT CTCGAAACTC TGCTGCTTCA TGGGCTAGAG 
CCAAGGCGTT TGATGCGTGC CCAGGTGTCT TATGCACAAA GACATTTAGC CAAGGAAGCT 
GGGTTTCGTT GGAATGATCC AATTCAAGGT GCCTGGACTC GACGCTTAAG TGATCGAGAG 
GCCGCCAAAC TGGAATTCCA AGTGGTTTCC ATTGATCAAC AAGAGGAGCA GCCATTGAGT 
GCATAA

Protein sequence

MGAGEYKQSI DEHGVGEAKQ HLFGAGQLDL LPDLNAEEAV VTPSKAVSTS KAVSTSKAVS 
TSKAVSLPQP HAPVALPSLH REALSSLPEM LLIIDTETTG LDPKRGQCLE VGAILFHAPQ 
RAVLAQHSFL LPVETNAAES INRIPAEVTR LDQPWRQGLD YFQALLDAAD LLVAHNAGFD 
RQWFGKDQLP AVSKPWLCTM EDIAWPVDRQ LRSRPSVRDL ALAYGVPVWA AHRALTDCIY 
LAEVFARCKD LETLLLHGLE PRRLMRAQVS YAQRHLAKEA GFRWNDPIQG AWTRRLSDRE 
AAKLEFQVVS IDQQEEQPLS A