Gene Acid345_1782 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_1782
Symbol
ID	4072842
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	2160215
End bp	2162203
Gene Length	1989 bp
Protein Length	662 aa
Translation table	11
GC content	58%
IMG OID	637983790
Product	excinuclease ABC subunit B
Protein accession	YP_590857
Protein GI	94968809
COG category	[L] Replication, recombination and repair
COG ID	[COG0556] Helicase subunit of the DNA excision repair complex
TIGRFAM ID	[TIGR00631] excinuclease ABC, B subunit

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.753339
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATCTCA AGGTAAGCTC CCCGTATAAA CCTCAGGGCG ACCAAGCCCG TGCGATTGAA 
CAACTGACCG GCGGGATTCG CGACGGCGAA AAGCACCAGG TGCTGCTCGG CGTAACCGGC 
TCCGGTAAGA CCTTCACGAT GGCGAAGATC ATCGAGCAGC TGAACCGCCC GGCGCTCATC 
CTGGCGCACA ACAAGACGCT GGCGGCGCAG CTTTATCACG AGTTCAAGAA CTTCTTCCCG 
AACAATGCTG TCGAGTACTT CGTCTCGTAT TACGACTACT ACCAGCCGGA GGCCTACATC 
CCTGCTGGCG ACGTTTATAT CGAGAAAGAA GCGACGGTTA ACGACGAGCT AGACAAGCTA 
CGGCTCGCAG CGACCCGGTC CTTGTTCGAG CGGCGCGACG TGATCATCGT GGCGAGCGTG 
AGCTGCATCT ACGGCCTTGG TTCGCCGGAA GCGTACTACG GCATGTTGCT CTTCCTCGAG 
AAGGGCCAGC GCATCAAGCG CGACGACATC CTGAAGAAGC TGGTCGAGAT CCTTTATGAG 
CGCACCAACG AAGATTTCCG GCGCGGAACC TTTCGAGTGC GCGGCGACGT AATCGAGATC 
TTTCCGACTT ACGAAGACAC CGCCTATCGC ATTGAGATGT TCGGGGACGA AGTCGAGTCG 
CTCTCGCAGA TTGATCCGCT GTTCGGCACG GTAAAACAGA AGTACCAGCG GCTGCCGATT 
TATCCGAAAA CGCACTACGT GATGAAGCCG GAGCGCAAGA ATTCGGCGGT TACCACGATT 
CTTGAAGAAC TCGGCTGGTG GGAGAACGAA CTGCAGAAGC AGGGACGCCT GGTGGAATCG 
CAACGCATTC ACCAGCGCAC GCGCTTCGAT CTCGAAATGA TCAAGGAGAT GGGCTACTGC 
CACGGCATCG AGAACTACTC GCGGCACTTT ACCGGCCGAC TACCAGGCGA GCCGCCGCCG 
ACGTTGCTCG ACTACATGCC GCGGGAGTTC TTGCTCTTCA TTGACGAGTC ACACCAGACC 
GTCCCGCAGC TACATGGCAT GTGGCACGGC GACCGTTCAC GCAAAGAGAA CCTGATCGAG 
TACGGCTTCC GGCTGCCGAG CGCGTTGGAC AATCGTCCGC TGACGTTTGA AGAGTTTGAG 
AACCGCGTGA ACCAGGCGGT GTACGTTTCG GCGACGCCGG GACCGTATGA GCTGACGAAA 
GCCGCAGGCG TGGTCGTGGA GCAGATTATT CGCCCGACGG GATTGATCGA CCCGGAAGTC 
GAAGTCCGTC CGGTAAAAGG ACAGATTGAC GACCTGCTGC ACGAGATCCG GAAGCGCGCG 
GAAAAGAGAG AACGCGTGCT GGTGACGACT CTGACCAAGC GCATGGCCGA GGACCTCAGC 
GAGTACTACA CCGAGGTCGG CGTGCGCTGC CGCTACATGC ACTCCGAGAT TGAAACGCTG 
GAGCGCATCA AGATCCTGCG TGATCTTCGC AAGGGTGAGT TCGATGTATT GATCGGCATC 
AATCTGTTGC GCGAAGGGCT CGACTTACCT GAGGTTTCGC TGGTGGCGAT TCTGGACGCC 
GACAAAGAAG GCTTCCTGCG CTCGCAGGGC TCGCTCATCC AGACCATGGG CCGTTGCGCC 
CGTAATCTCG AAGGGCGCGC GATCCTTTAT GCGGACCGCA TGACTGACTC GATGAAGAAG 
GCGATGGACG AGACCTATCG TCGCCGCGCG ATTCAGGAGG CTTACAACGT GGAGCACGGC 
ATCACGCCGG AGTCGATCGT TCGCCCAGTA GATATGGCCC TGGCTGCGAT CGTGGGCGCG 
GACTACGTGG ATCTCACCGC GCAGCCGGAT GAGATACCGG AGTTCAAATC GCAGGAGCAG 
TTGGATAAGT TCGTGGAGAA ACTCGAGGGC GAGATGCGCG AAGCGGCCAA GCGATTTGAG 
TTCGAGAAGG CGGCGAAGCT GCGCGATCAG ATCAAGGAAC TACGGACCAA AGAGTTCATG 
TTCACTTAG

Protein sequence

MDLKVSSPYK PQGDQARAIE QLTGGIRDGE KHQVLLGVTG SGKTFTMAKI IEQLNRPALI 
LAHNKTLAAQ LYHEFKNFFP NNAVEYFVSY YDYYQPEAYI PAGDVYIEKE ATVNDELDKL 
RLAATRSLFE RRDVIIVASV SCIYGLGSPE AYYGMLLFLE KGQRIKRDDI LKKLVEILYE 
RTNEDFRRGT FRVRGDVIEI FPTYEDTAYR IEMFGDEVES LSQIDPLFGT VKQKYQRLPI 
YPKTHYVMKP ERKNSAVTTI LEELGWWENE LQKQGRLVES QRIHQRTRFD LEMIKEMGYC 
HGIENYSRHF TGRLPGEPPP TLLDYMPREF LLFIDESHQT VPQLHGMWHG DRSRKENLIE 
YGFRLPSALD NRPLTFEEFE NRVNQAVYVS ATPGPYELTK AAGVVVEQII RPTGLIDPEV 
EVRPVKGQID DLLHEIRKRA EKRERVLVTT LTKRMAEDLS EYYTEVGVRC RYMHSEIETL 
ERIKILRDLR KGEFDVLIGI NLLREGLDLP EVSLVAILDA DKEGFLRSQG SLIQTMGRCA 
RNLEGRAILY ADRMTDSMKK AMDETYRRRA IQEAYNVEHG ITPESIVRPV DMALAAIVGA 
DYVDLTAQPD EIPEFKSQEQ LDKFVEKLEG EMREAAKRFE FEKAAKLRDQ IKELRTKEFM 
FT