Gene Acid345_0779 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0779
Symbol
ID	4069524
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	961481
End bp	963307
Gene Length	1827 bp
Protein Length	608 aa
Translation table	11
GC content	60%
IMG OID	637982785
Product	ATP dependent DNA ligase
Protein accession	YP_589858
Protein GI	94967810
COG category	[L] Replication, recombination and repair
COG ID	[COG1793] ATP-dependent DNA ligase
TIGRFAM ID	[TIGR02776] DNA ligase D [TIGR02777] DNA ligase D, 3'-phosphoesterase domain [TIGR02779] DNA polymerase LigD, ligase domain

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.991922
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.120219
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCACTCG AGGAATACAA AAAGAAACGT CGCTTTACTG ACACCCCCGA GCCTCCACCC 
TCGATCGACA AAAGCAAAGG TCATCGCTTC GTGGTGCAGA AGCACCACGC CTCACGTCTC 
CACTACGACT TCCGCCTTGA GATGGACGGC GTGCTGAAGT CCTGGGCCGT GCCCAAAGGC 
CCATCGCTCG ATCCCGCCGA CAAGCGCCTC GCCATGGCTG TCGAAGATCA TCCCGTCTCG 
TATCTCAAAT TCGAAGGCAT CATCCCCGAG AACAACTACG GCGCAGGCAC CGTGATGGTC 
TGGGACATCG GCACCTGGGA GCCGGTTGGC GACGCCGACG CCATGCTCGC CAAGGGCGAT 
CTCAAATTCC GGTTGAAGGG CAAAAAGCTC AACGGCGAAT TCGCTCTGGT GCACATCAAG 
TCGCGCCGCT CCGGCACCAA GGGTAACGAG TGGCTGCTGA TCAAGCACCG CGATGACGCC 
GTCGTCCCTG GCTACGACAT CGACGAGTAC GACTTCTCCG CCCTCACCAA GCGCTCGCTC 
GACGACATCG CCGGCGACCA GAAATCGGCC GAGTGGCAAA GCAATCGCGC CGGATCCTCC 
AACATCCCGC AGAAAAGCGC GTGGCTCGCG GACGCCATCA AGAAGGCCGA CAAGAAAGCT 
GCCGCAAAAA AGACCGCTGT AAAAACAAAG GCTCCAGCAA AAAAGTCCGC CAAAACCGCA 
GCCAAGAAAG CTGTGAAGAC CACCGCAACC AAGAAACAGA AAGACGCGCA CCCGGCGTTC 
GCCGATCTCA AAGGCGCGCG TCACGCCGCG ATGCCGTCGC AAATCCAGCC CATGCTCGCC 
ACGCTCGTAG ATGAGCCCTT TGAAGACTCC CAGTGGCTCT ACGAGATCAA GTGGGACGGC 
TATCGCGCCG TCACCTTCCT CAACGATGGC AAACTTCGCT TCGTCTCGCG CAACGGCAAC 
GACCTAACTA ACGCCTATCC TGAACTGCAC GACATCGGCG GAAGCATCTC CGCGCAACGC 
GCCATTCTCG ACGGCGAAAT CGTCGCCCTC GACGGCGAAG GCCGCTCCTC CTTCAGCCTG 
ATGCAACAAC GCACTGGCAT CGGCGAGGGC GGACGCCGCA CCGGCAAGGG CAACGCCAAC 
ATTCCCGTGC AGTATTACGC CTTCGACCTG CTCTACCTTG ACGGCTACGA CCTCACGCAC 
GTCTCGCTCG AGGACCGCAA ACGGGTGCTC AGCGAAATCA TCTCGCCCAG CGACGTACTG 
CGTGTCTCTG ACTCCTTCGA CGAGGGCCTG CCTCTCTACG AAGCCGCCCG CGCGCGCGGG 
CTCGAAGGCA TCATCGCCAA GCGTCGCGAG AGTTGCTATC TCACCAAGCG CAGCCGCGAG 
TGGCTGAAGA TCAAGATCAC GCAGCGCCAG GAGTGCGTGA TTGGCGGCTA TACCGAGCCC 
AAGGGCAGTC GCGAAAATTT CGGCTCCGTC GTCCTCGGCC TCTACGACGA CAAAGGCCGC 
CTCATCCCCG TTGGCCAGGC CGGCAGCGGT TTCACCGCCC AGTCAAACGC TGCCCTGTGG 
AAGAAACTCC AGAAGCTCGA AACCAAAACT TCACCGTTCT TCGGCAAGCC CGACAGCCCG 
CGCCAGGTCC ACTATGTCCG CCCTGAACTC GTTGCCGAAA TCAAGTTCAC CGAGTGGACG 
CACCAAGGCC AAAGCGGCCA GGTCAGAATG CGCGCCCCTG TTTTCGAAGG GCTGCGCACT 
GACAAATCGC CGAGCGAATG CGTCTTCGAT TTCGCGAAGC CAACAAAATT AGAAGTGAAA 
AAAGCCGAAA GCGGCGACGC CGCGTAG

Protein sequence

MALEEYKKKR RFTDTPEPPP SIDKSKGHRF VVQKHHASRL HYDFRLEMDG VLKSWAVPKG 
PSLDPADKRL AMAVEDHPVS YLKFEGIIPE NNYGAGTVMV WDIGTWEPVG DADAMLAKGD 
LKFRLKGKKL NGEFALVHIK SRRSGTKGNE WLLIKHRDDA VVPGYDIDEY DFSALTKRSL 
DDIAGDQKSA EWQSNRAGSS NIPQKSAWLA DAIKKADKKA AAKKTAVKTK APAKKSAKTA 
AKKAVKTTAT KKQKDAHPAF ADLKGARHAA MPSQIQPMLA TLVDEPFEDS QWLYEIKWDG 
YRAVTFLNDG KLRFVSRNGN DLTNAYPELH DIGGSISAQR AILDGEIVAL DGEGRSSFSL 
MQQRTGIGEG GRRTGKGNAN IPVQYYAFDL LYLDGYDLTH VSLEDRKRVL SEIISPSDVL 
RVSDSFDEGL PLYEAARARG LEGIIAKRRE SCYLTKRSRE WLKIKITQRQ ECVIGGYTEP 
KGSRENFGSV VLGLYDDKGR LIPVGQAGSG FTAQSNAALW KKLQKLETKT SPFFGKPDSP 
RQVHYVRPEL VAEIKFTEWT HQGQSGQVRM RAPVFEGLRT DKSPSECVFD FAKPTKLEVK 
KAESGDAA