Gene Acid345_3541 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3541
Symbol
ID	4069273
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	4187646
End bp	4189580
Gene Length	1935 bp
Protein Length	644 aa
Translation table	11
GC content	61%
IMG OID	637985564
Product	ATP-dependent DNA helicase RecQ
Protein accession	YP_592616
Protein GI	94970568
COG category	[L] Replication, recombination and repair
COG ID	[COG0514] Superfamily II DNA helicase
TIGRFAM ID	[TIGR00614] ATP-dependent DNA helicase, RecQ family

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.133366
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCGATT CCCTCAGCGC AGACATCAAC TCGGCCCTCA AGCACTACTT CGGCTACGAC 
CGCTTCCGCC CGCTGCAGGA ACGGATCATC CGCAGCATCG TCGCCAATAA AGACGTCTGC 
GTCATTATGC CGACGGGCGG CGGAAAGTCG CTCTGCTACC AGCTTCCGGC GGCGATCTCG 
CAAAAGACTA CGGTCGTCAT CTCCCCGCTC ATCGCGCTTA TGAACGATCA GGTCGTCCAA 
CTCACGCAGA TGGGCATTCC CGCCGCGTTG TTGAACAGCA GCTTGCCGTA TGACGAACAG 
AAGAAGGTGA TGCGCGCCGC CCGCGAGGGC AAGTACCGCT TGTTGTATCT CTCGCCCGAG 
CGCCTGGTGC GCGAAGACAC TGTCGGATGG CTGCGCACCG TGCCGCTCGG CGTGTTTGCT 
ATCGACGAGG CGCACTGCAT CTCCGAGTGG GGACACGAGT TTCGACCCGA GTATCGGCAA 
CTCAAGCTAC TGCGCAACAG TTTTCCCGAC GTCCCCATCG CGGCCTTCAC CGCCAGCGCC 
ACGCAGCGCG TGCGTCACGA CATCGTCCAT CAACTTGCGC TGCGCGAGCC CGACAAATAC 
ATCGCCAGCT TCCATCGCCC CAACCTGCGC TACATCATTC GCCAGACCGA CCCCTACGGC 
CAGCGCGACA TGCTGCTCCG CGCGCTGCGC AGCTACGCCG GCCACAACGT CATCGTCTAT 
GCGCCGACGA TCAAAATGGT GGAAGAGGTC GCCGACTTTC TAATCGACAA GAAGATCCCC 
GCCGTCCCCT ACCACGGACA GATGGATTCG GCGCTGCGCA CCAGGAACCA GGAGAAGTGG 
ATGACCGACG AGGTGCGCGT GCTCGTCGGA ACCATTGCGT TCGGCTTGGG AATCAACAAG 
CCTGCGGTGC GCGCGGTCAT TCACCTGGCA GTTCCGAAGT CGCTGGAGAA CTATTACCAG 
GAAGCGGGCC GCGCCGGACG CGACGGCCTC CCCGCCGATT GCGTGATGCT CTGGCAGCCC 
AAAGACCTCG GCTTGCTCGT GTACTTCATC CAGCAAATGC AGGACACCAG CGAGAAGAAG 
CGAGCCTGGG AGCGCTACCA GGTCATCAGC GAATTCGTGA AGTCGGACGA GTGCCGCCAC 
AAGCAGATCT GCGAACACTT CGGCGAGAAA AAGAGTTTCG ACGACTGCGT GGCATGCGAC 
ATCTGCGGCG CAACCGTCGG CTGGATGACC GCTCCGGTCC CCGAGCCCAT GCCCGGCGAT 
CCGCCAATCA AGCTGGGACT GCCGGAAGGG AAAAAGCCGA AGAAGAAACT TCGCGCGCCG 
CAACCCTCGG AAATCGAGCA CGCCATGCCG CTCGACGATG CGCTGCTCGA CTTCTTCCGC 
CTGTGGCGAC GCGACGAAGC CAAGCGCCGC GGTGTTCCGG CCTACGTGGT CATGCACGAT 
ACATCGCTTG AACACCTCTG CCGGGTAAAA CCGAAGACGC TGGAACAAGT GCGAAGCATC 
TCCGGCTTCG GCGACTTAAA GACCGCCGAT TACGGCCCGG GCATCCTGAA AGCCCTCGCC 
GAATTCGACG CCGGCAAGCG CGCCCTCCAG GATTTGGCTC CGCGCCTCGA ACCGACCGGC 
CCCAGCCCTT CACACGAAAC GCTGGACCTC CTCCGCAAAG GCCATTCCTT CGCCGAGATC 
GCCAACATCC GCGGCCGCCA GTTGCAAACG GTCATGGCCG CCGTAGCGAA CCTAGTCGAG 
ACCGGCGATA TCGAGTTCGA TCCCAAGTGG GTGAAAGAAG ATCGTCGGCT CGCGATTGAA 
AACGCATGTG AGAAAGTCGG GACGGCGCGG CTGAAACCGG TGAAGGATTT AGTGGCGGCC 
GAGGTGACGC TGGGGGAAGT GCATTTGGTG GTGGCTAAGA AGAGGTGGGA AGAGAAGAGA 
AGAGACAAGG AGTAG

Protein sequence

MTDSLSADIN SALKHYFGYD RFRPLQERII RSIVANKDVC VIMPTGGGKS LCYQLPAAIS 
QKTTVVISPL IALMNDQVVQ LTQMGIPAAL LNSSLPYDEQ KKVMRAAREG KYRLLYLSPE 
RLVREDTVGW LRTVPLGVFA IDEAHCISEW GHEFRPEYRQ LKLLRNSFPD VPIAAFTASA 
TQRVRHDIVH QLALREPDKY IASFHRPNLR YIIRQTDPYG QRDMLLRALR SYAGHNVIVY 
APTIKMVEEV ADFLIDKKIP AVPYHGQMDS ALRTRNQEKW MTDEVRVLVG TIAFGLGINK 
PAVRAVIHLA VPKSLENYYQ EAGRAGRDGL PADCVMLWQP KDLGLLVYFI QQMQDTSEKK 
RAWERYQVIS EFVKSDECRH KQICEHFGEK KSFDDCVACD ICGATVGWMT APVPEPMPGD 
PPIKLGLPEG KKPKKKLRAP QPSEIEHAMP LDDALLDFFR LWRRDEAKRR GVPAYVVMHD 
TSLEHLCRVK PKTLEQVRSI SGFGDLKTAD YGPGILKALA EFDAGKRALQ DLAPRLEPTG 
PSPSHETLDL LRKGHSFAEI ANIRGRQLQT VMAAVANLVE TGDIEFDPKW VKEDRRLAIE 
NACEKVGTAR LKPVKDLVAA EVTLGEVHLV VAKKRWEEKR RDKE