Gene Acid345_4656 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4656
Symbol
ID	4070813
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	5512291
End bp	5514312
Gene Length	2022 bp
Protein Length	673 aa
Translation table	11
GC content	60%
IMG OID	637986696
Product	DNA ligase, NAD-dependent
Protein accession	YP_593730
Protein GI	94971682
COG category	[L] Replication, recombination and repair
COG ID	[COG0272] NAD-dependent DNA ligase (contains BRCT domain type II)
TIGRFAM ID	[TIGR00575] DNA ligase, NAD-dependent

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.203554
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCCGCA CCAAAGATCC CGCAAAGCAA GCCGAAGACC TGCGCGAAAA GCTGCGTTAT 
CACGAACATC GCTATTACGT GCTCGACGAC CCGGAAATCT CGGACGCCGA CTATGACGTG 
ATGATGAACG AGTTGAAGGC CTTGGAGGCC AAGCACCCCG AGCTGTTGAC CCCGGATTCG 
CCCACCCAGC GCGTGGGCGG AAAGCCGCGC GAGGGCTTTG TAAAAGTGGC GCATTCCGCG 
CCCATGCTGT CGCTGGACAA CGCCTACAAC GAGGAGGAAC TCCGCGACTG GGCCCGGCGC 
GTAGAAGAAC TCAGCGGGAA GGCCGAGATC GAGTACGAGT GTGAGTTGAA GCTGGATGGG 
CTCTCGATGG CGCTGCGCTA CCAGGATGCG CGCTTTGTGC TGGCCGTCAC CCGCGGCGAT 
GGCTCCATCG GCGAAGACGT GACGCTCAAC TTGCGGACAG TGAAGTCGGT GCCGCTCGGC 
GTCAGTTCCG CCACGTTGAA GAAGACCCAC ATGCTCGGCG ATTTCGAAGT GCGCGGCGAA 
GTGATCTTCC CAACCAAATC GTTCGAGAAG ATGAACGAAG ACCGCGAAAA GCAGGGGCTG 
GCGAAGTTTG CTAACCCGCG AAACGCGGCG GCCGGCGCCG TGCGCGTGCT GGAGCCCAAC 
ATCACCGCGC AGAGGCGTCT GGATTTTTAT GCGTACTTCC TGCTGGTGGA CGGCCGCGTG 
CATATCGATC GGCAATCCGA GGCGCTCGAC ACGTTGGAGA AACTTGGGTT CAAGGTGAAT 
TCCAATCGCG CGGTCTTCAA GTCGATTGAT GACGTGCTGA AATTCATCCA CAAGAAAGAA 
GAAGATCGCG AGAAGCTGCC TTACGAAATT GACGGCGTCG TGATCAAGGT CAACAGCACC 
GCACTCTGGC AGCGCCTGGG CTTCACCGGC AAAGCGCCGC GTTGGGCGAT CGCTTACAAA 
TACGCGGCGC GCGCGGCCGT TACGCAGGTG GAAGACATTC TTGTGCAGGT GGGACGCACC 
GGGAAACTCA CGCCAGTCGC GGCTTTGAAG CCTGTGCCCA TCGGCGGCAC AACGGTGAGC 
CGCGCCACCC TCCACAACAT GGACGAGATC GATCGCCTTG GATTGCTCAT CGGCGATTGG 
GTGCAGGTCG AGCGCGGCGG CGATGTGATC CCCAAGGTCG TGAAGGTCAT CGACGACAAG 
GATCACCCGC GCGGCAAGAA GAAATTCAAG ATGCCCGAAC GTTGCCCCGA ATGCGGCGGC 
CACGTTGTAC GCACCGAGGG CGAGGCCGAC CATCGCTGTG TGAATGCGAA TTGTCCGGCG 
AAACTGCGCG AGAGCATTCT GCACTTCGCG TCGCGCGGCG TGATGAACAT CGAGGGAATG 
GGCGATTCGC TGGTCAACCA ACTCGTCGAC CGAGGGCTGG TAAAGAACGT GGCCGATATC 
TACGAACTCG ACGAAGAGAA GCTTCTCTCG CTCGAGCGCA TGGGCAAGAA GTCAGCTCAG 
AACATCCTCG ACGAGATTAA AGGCACGAAG AAGTTGCCGC TGGAGCGCGT GATCTACGGT 
CTCGGCATCC GCATGGTAGG CGAGCGCACC GCGCAATTCC TCGCCGAACA CTTCGGTTCG 
CTCGATGGCG TGATGAAAGC CACCGAAGAA GAGCTGCTGG AAGTCGAAGA AGTCGGGCCG 
CGCATCGCGC AGAGTATTCA CGAGTTCTTC GCCGAGCCCA GCAATCGCGA ACTGGTAAAA 
CGCCTCGAAG CCGCCGGGCT GCAATTCAAG GGCGTAAAGA AAGAGCGCGG CACCGCGCTC 
GCCGGACAAA CCTTCGTCCT GACCGGCAGC TTACCGACCT ACTCGCGCGA TGAAGCCAAG 
AAACTGATCG AAGATGCCGG CGGAAAAGTC AGTGGGTCGG TGAGCAAAAA AACCAACTAT 
GTCGTCGCCG GCGAAGAGGC CGGATCGAAG CTCGACAAAG CCCGCGACCT GGGCGTTGCG 
GTAATCGACG AAGATGCCCT GAAAAAACTG CTAGGGAAGT AG

Protein sequence

MSRTKDPAKQ AEDLREKLRY HEHRYYVLDD PEISDADYDV MMNELKALEA KHPELLTPDS 
PTQRVGGKPR EGFVKVAHSA PMLSLDNAYN EEELRDWARR VEELSGKAEI EYECELKLDG 
LSMALRYQDA RFVLAVTRGD GSIGEDVTLN LRTVKSVPLG VSSATLKKTH MLGDFEVRGE 
VIFPTKSFEK MNEDREKQGL AKFANPRNAA AGAVRVLEPN ITAQRRLDFY AYFLLVDGRV 
HIDRQSEALD TLEKLGFKVN SNRAVFKSID DVLKFIHKKE EDREKLPYEI DGVVIKVNST 
ALWQRLGFTG KAPRWAIAYK YAARAAVTQV EDILVQVGRT GKLTPVAALK PVPIGGTTVS 
RATLHNMDEI DRLGLLIGDW VQVERGGDVI PKVVKVIDDK DHPRGKKKFK MPERCPECGG 
HVVRTEGEAD HRCVNANCPA KLRESILHFA SRGVMNIEGM GDSLVNQLVD RGLVKNVADI 
YELDEEKLLS LERMGKKSAQ NILDEIKGTK KLPLERVIYG LGIRMVGERT AQFLAEHFGS 
LDGVMKATEE ELLEVEEVGP RIAQSIHEFF AEPSNRELVK RLEAAGLQFK GVKKERGTAL 
AGQTFVLTGS LPTYSRDEAK KLIEDAGGKV SGSVSKKTNY VVAGEEAGSK LDKARDLGVA 
VIDEDALKKL LGK