Gene Acid345_2389 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2389
Symbol
ID	4071387
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	2825771
End bp	2827525
Gene Length	1755 bp
Protein Length	584 aa
Translation table	11
GC content	60%
IMG OID	637984405
Product	DNA polymerase X family protein
Protein accession	YP_591464
Protein GI	94969416
COG category	[L] Replication, recombination and repair
COG ID	[COG1796] DNA polymerase IV (family X)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.766089
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGAGAACC GACAGCTCGC CAACATCTTT TACGAGACCG CCGACCTCAT GGAGGTCCAG 
GGCGACGACC CCTTCCGCAT TCGCTCCTAC CGCCGCGCCG CCGAAGCCCT CGAAAGTCAG 
CCCACCCAGA TCGCCGACAT CATCTCCGAC GACAAAGCCG TCCTCGCCAT TCCCGGCATC 
GGCAAAGGCA TGCTGCTAAA CCTCCAGGAA ATTTTCCGCG AAGGCCGTCT GAAGCTCCAT 
GCCGAGCTCC TCGAAAAATA TCGCCCCTCG ATGCTCGAGC TATTGAAGAT TCAAGGCCTC 
GGCCCCAAGA CCATCGCACT CATCTGGAGC GCCTTCCAGG TCAGCGACCT CGCCGGCGTC 
GAAACCCTCG CGCGCGAGGG CAAACTCCGC ACCCTGCCCC GCTTGAGTGA AAAGACTGAG 
CAGAAGATTC TCAAGTCCAT CGAGACCTAT CGCAGCATCT CCGGCCGCTT CCTCATAGAC 
ACCGCCGACC AGACCGCCGA GAAAATGATC GCCCACCTCC GAGAGGTGAA AGGCGTGGAG 
AAGATCACGC CCGCCGGATC CCTACGCCGT GGCCGCGAAA CCGTCGGCGA TCTCGACATC 
CTCGTCACCG GCCCCTGCGC CAAAAACGAG CAACAGCGCG ACGCCGTTAT CGAGCACATC 
CTCAAATTTC CCGGCATCCT CGACATCCTC GTCAAGGGCG AGAACAAGGT CAGCTTCAAA 
CTTCGCACCG GCATGCAGGT AGATGTCCGC ATCCTTCCCC CCGAGTCGTT CGGTGCTGCG 
ATGCAATACT TCACCGGCTC CAAGAACCAC AACGTCACGT TGCGCCAGCG CGCTCTCAAG 
ATGGGCTATA CCCTCAACGA GTACGGTCTC GCCAAGCTCG ACGACAATTC GATCGTCGCC 
AGCCATACCG AAGATGAGAT CTACGCCAAG CTCGGCCTCG ACTGCCCTCC TCCAGAAATG 
CGCGAGAACT GCGGCGAAAT CGAACTTGCC GACAAACACG AACTCCCGTG CCTTATCGAA 
GAGAAAGATA TCCGCGGCGA CGTCCACATG CACACCGTCG AAACCGACGG ACGCAACACC 
ATCGAGGAGA TGGCTCAAGC TGCGAAAGCT CGCGGCTATG AATACATCGC CATCACCGAC 
CACTCCAAGA ACCTCGCCAT GGCCAACGGC CTCGATGACA GGCGCGCATT AGAGCACATC 
AAGCGCATCC GCCGCGCCAG CGATCAGCTC GAAGGCATCA CCATCTTCGC CGGCATCGAA 
TGCGACATCC TCGCCGACGG CGCCATGGAT CTCTCCGACG AAGTCCTGGC CCAAATGGAC 
ATCGTCATCG CCAGCGTCCA CTCCCATTTC TCACAGGAGC GCGCCGAGAT GACCGAGCGC 
GTCCTCAAAG CCATCGCCAA TCCGCACGTC AGCCTCCTCG GCCATCCCAC CGGTCGCCTG 
CTCCTCCGCC GCGACGCCTA CGCCCTCGAC ATGGACGCCG TGATGAAAGC CGCCGCCCAG 
CACAGAGTCG CCATGGAACT CAACGCCAGT CCCGATCGCC TCGACCTCAG CGACGTCCAC 
CTCCGCATGG CCCGCGAGCG CGGCATCCCG TTAGTCATCA ACACCGACGC CCACCACACC 
TCGCACTTCG ATCTTCTGAA ATACGGCATC CTGCAAGCCC GCCGCGCCTG GCTCACAAAG 
AAAAATGTGC TGAACACGCT ACCGATAGAA AAGTTCAAAC AAGCGCTCAA GAAAGATTGG 
TCTTCTGCCG CATAA

Protein sequence

MENRQLANIF YETADLMEVQ GDDPFRIRSY RRAAEALESQ PTQIADIISD DKAVLAIPGI 
GKGMLLNLQE IFREGRLKLH AELLEKYRPS MLELLKIQGL GPKTIALIWS AFQVSDLAGV 
ETLAREGKLR TLPRLSEKTE QKILKSIETY RSISGRFLID TADQTAEKMI AHLREVKGVE 
KITPAGSLRR GRETVGDLDI LVTGPCAKNE QQRDAVIEHI LKFPGILDIL VKGENKVSFK 
LRTGMQVDVR ILPPESFGAA MQYFTGSKNH NVTLRQRALK MGYTLNEYGL AKLDDNSIVA 
SHTEDEIYAK LGLDCPPPEM RENCGEIELA DKHELPCLIE EKDIRGDVHM HTVETDGRNT 
IEEMAQAAKA RGYEYIAITD HSKNLAMANG LDDRRALEHI KRIRRASDQL EGITIFAGIE 
CDILADGAMD LSDEVLAQMD IVIASVHSHF SQERAEMTER VLKAIANPHV SLLGHPTGRL 
LLRRDAYALD MDAVMKAAAQ HRVAMELNAS PDRLDLSDVH LRMARERGIP LVINTDAHHT 
SHFDLLKYGI LQARRAWLTK KNVLNTLPIE KFKQALKKDW SSAA