Gene Acid345_4172 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4172
Symbol
ID	4072131
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	4938195
End bp	4939934
Gene Length	1740 bp
Protein Length	579 aa
Translation table	11
GC content	61%
IMG OID	637986203
Product	single-stranded-DNA-specific exonuclease RecJ
Protein accession	YP_593246
Protein GI	94971198
COG category	[L] Replication, recombination and repair
COG ID	[COG0608] Single-stranded DNA-specific exonuclease
TIGRFAM ID	[TIGR00644] single-stranded-DNA-specific exonuclease RecJ

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.698282
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.703771
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGCTGGA CCCAACGCCC CTTCGACTTC TCCGTCGCCA GCCGTCTCTC GGCTGAGGCC 
AATATCTCAC CCCTGGTTGC CGTGCTGCTG GCCGCACGCG GCATCAAATA TTCCGACGAA 
GCCTGGATGT TTCTCAATCC TTCGCTCGAT GCCTTGCACT CGCCCTACGA AATGCTCGGT 
ATGGACGCCG CCGTCGAGCG CCTCATGGCC GCGATCGCGA AGAAGGAACA AGTCCTCATT 
TACGGCGACT ACGACGTCGA CGGCACTACC GCCACCGTCA TCCTGAAAAC CGCCATCGAG 
ATCTGCGGCG GACGCGCGGA ATTTCACGTC CCGCACCGTC TCCTCGAAGG CTACGGCATG 
CGCGACGAGG TCATCGAGAA AGCCGCAGCC GATGGCATCC GCCTCATCAT CAGCGTGGAC 
ACCGGCATTC GCGCCTTCGC CGCTGCGGAA ACCGCGAGCC GCCTCGGCCT CGATTTGATC 
GTTACCGATC ACCACCTTCC CGGTGCGGAC GGCGTGCCCA AAGCTCTCGC CGTACTCAAC 
CCGAATCAAA CCGGCTGCGA CTATCCGTGC AAACATCTCT GTGGCGCCGG CGTCGCGTTC 
AAAGTCGCGC AAGCTCTCCT CGAAAAATCC GATCGCGCTC GCTTGATTCC GTCATTCTTG 
AAGATGGCCG CCATCGCCAC GATCGCTGAC GCCGTACCCC TCACTGGCGA GAACCGCGTC 
TTCGTCAGTC TCGGACTTGA AGGCTTGCGT AAGCCCGTCA ACGCCGGTTT GAAAGAGCTG 
CTTGCACTCT GTCGCATTGA CGGCCGCACC CTTTCCACTC AGGACGTCGC CTTCCGTATC 
GCCCCGCGAC TCAACGCCGC CGGCCGCATG GATGTTGCCC GCGACGTTGT CGAACTCTTT 
ACTACCAGGG ACGCGAAACA CGCGAAGGAC GTCGCACAGC ACCTCAACAA GCTCAATGGC 
GATCGCCAGG AAGAAGAAGC CCGCATCATG GCCGCCATCG AGAAGCAGCT AGCTGACGAC 
GCTTCATTCA AGGACCGATA CTCATTTGTG CTCGATGGCG CGGAGTGGCA TCGCGGCGTC 
ATCGGTATCT GCGCCAGCCG TGTAGTCGAT CGCGTGCATC GTCCCGCGCT GGTCATCGCG 
CGTCACGAAG GCGAAGCCCA CGGCTCCGGC CGCTCTATCC CGTCATTCCA TTTGCTCAAC 
GCGCTGGAAT CGTGTGCCGA CCTTTTCTCG CGTTACGGCG GTCACGCTCA CGCCGTCGGC 
TTTGCGCTGC CGGAAGACAG GCTTCCACAA CTCCGCGAGA AACTTGAAGC CTACGCGCGC 
CAACATCTCA AGCCCGCGGA CTTCGTCCCC GAGATGGTTT ACGACACCGA ACTGCCACTC 
AGTGACGTCA GCGAGAAGCT CTACCTCATG CTGCAGAAGC TGGAGCCGTT TGGGATGAGC 
AACCCGCAAC CGGTTTTCGT CAGCCGCGGC GCGCGCCTCG CTGGCCCTGC AAGGACGCTT 
AAAGAGAAGC ACGTGAAAAT GCGCCTCGCC CCACAATCCA ACGGCGGCTT CCAGCGTTCC 
TTCGAAGCCC TCGCCTGGCG CAAAAACGAG AAGCTGCAAG CCGAGCCACC GCTAAACATG 
GGCGATCTTT TAGACGTCGC GTTCACCATC GACCACAACG ATCATCCCGA CTTCGGTGGC 
CTGCAATTGA TTTTGTGCGA TTGGGCGAAA CCCGCTGCCA GCGCCTCTTC CGCGCGATAG

Protein sequence

MRWTQRPFDF SVASRLSAEA NISPLVAVLL AARGIKYSDE AWMFLNPSLD ALHSPYEMLG 
MDAAVERLMA AIAKKEQVLI YGDYDVDGTT ATVILKTAIE ICGGRAEFHV PHRLLEGYGM 
RDEVIEKAAA DGIRLIISVD TGIRAFAAAE TASRLGLDLI VTDHHLPGAD GVPKALAVLN 
PNQTGCDYPC KHLCGAGVAF KVAQALLEKS DRARLIPSFL KMAAIATIAD AVPLTGENRV 
FVSLGLEGLR KPVNAGLKEL LALCRIDGRT LSTQDVAFRI APRLNAAGRM DVARDVVELF 
TTRDAKHAKD VAQHLNKLNG DRQEEEARIM AAIEKQLADD ASFKDRYSFV LDGAEWHRGV 
IGICASRVVD RVHRPALVIA RHEGEAHGSG RSIPSFHLLN ALESCADLFS RYGGHAHAVG 
FALPEDRLPQ LREKLEAYAR QHLKPADFVP EMVYDTELPL SDVSEKLYLM LQKLEPFGMS 
NPQPVFVSRG ARLAGPARTL KEKHVKMRLA PQSNGGFQRS FEALAWRKNE KLQAEPPLNM 
GDLLDVAFTI DHNDHPDFGG LQLILCDWAK PAASASSAR