Gene Acid345_3429 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3429
Symbol	ligC
ID	4070313
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	4049479
End bp	4050603
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	60%
IMG OID	637985451
Product	ATP-dependent DNA ligase
Protein accession	YP_592504
Protein GI	94970456
COG category	[L] Replication, recombination and repair
COG ID	[COG1793] ATP-dependent DNA ligase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGCGTC GCTCCGCAGT TAAGAAGTCA CCGAAGCTCT CCGACGGCGC CGTTTCCGCC 
GAAGACTTAA AGCAACAGTT TCAAAAGTTA AAGCTCCCCA TCCAGCCGCC TTTCCCGCCG 
ATGGAAGCCA AGCTGGTGGA CGCCATTCCC GAAGGCGCGC TCTGGCAATA CGAGCCCAAG 
TGGGATGGCT TCCGCTGCGT GGCGTTCCGC GATGGCGACA CCGTCGAGTT GCAATCCAAA 
GCCGGGCAGC CGCTCGGCCG TTACTTCCCG GAAATCGTGG AAGCGTTGCT GAAGCTCAAG 
CCGACAGAGT TCGTGCTCGA TGGGGAGATC GTGATCCTGC GCAACGGCCA CCTCTCGTTC 
GACGATCTGC TCATGCGCAT TCATCCCGCG GCAAGCCGGA TCAAGAAGCT TTCGGTGGAG 
ACCCCAGCGA CCTATCTCGT GTTCGATCTT CTCGTGGATG ACAAAGCGCA TTCGCTCGTC 
GAAGAAACGC AGGCCGCCCG CCGCGAACGC CTCGAGCTGT TCTTCAAGAC GTTCAAGGGA 
AACGCGAGCG TCCGCCTCTC TCCCATGACC CGCGATCACG CCGAAGCTGA GAAGTGGATG 
AAGAAACTGG CTGTCATTGG ATTCGATGGC GTGGTGGCGA AAGCGCTCGA CCAACCGTAT 
CAATCGGGCG AGCGCGCCAT GCGCAAGATC AAACGCATTC GCACCGCTGA TTGCGTCGTC 
GGCGGATTCC GCTACGCGTC GAAAGGCGGC GAGGTCGGCT CGCTCCTGCT CGGCGTCTAC 
AACGACGAAG GCCAACTCGA CCACATCGGC TTCAGCTCCA GCTTTGCAAG GGAAGAGCGC 
AAACAGTTAA AGAAGATCTT GAAGCCCTAC ATGAACGGCG AAGGCTTTAC CGGCAAAGCT 
CCGGGCGGCC CGAGCCGATG GAGCACAGAG CGTACCGGCG AGTGGGAGCG GCTCGATCCC 
AAACTCGTCT GCGAGGTCAG CTACGACCAC TTCTCCGGCG GACGCTTTCG CCACGGCACC 
AAGTTCCTGC GCTGGCGTCC GGAGAAAGAA CCGAAGAGCT GCACCTATGA GCAGATCACG 
CCAGCAAAAC AACGCGGCTC AATGGACCAA TTCCTCGCGG CCTAG

Protein sequence

MPRRSAVKKS PKLSDGAVSA EDLKQQFQKL KLPIQPPFPP MEAKLVDAIP EGALWQYEPK 
WDGFRCVAFR DGDTVELQSK AGQPLGRYFP EIVEALLKLK PTEFVLDGEI VILRNGHLSF 
DDLLMRIHPA ASRIKKLSVE TPATYLVFDL LVDDKAHSLV EETQAARRER LELFFKTFKG 
NASVRLSPMT RDHAEAEKWM KKLAVIGFDG VVAKALDQPY QSGERAMRKI KRIRTADCVV 
GGFRYASKGG EVGSLLLGVY NDEGQLDHIG FSSSFAREER KQLKKILKPY MNGEGFTGKA 
PGGPSRWSTE RTGEWERLDP KLVCEVSYDH FSGGRFRHGT KFLRWRPEKE PKSCTYEQIT 
PAKQRGSMDQ FLAA