Gene lpp1020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	lpp1020
Symbol	lig
ID	3117317
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Legionella pneumophila str. Paris
Kingdom	Bacteria
Replicon accession	NC_006368
Strand	+
Start bp	1136515
End bp	1138536
Gene Length	2022 bp
Protein Length	673 aa
Translation table	11
GC content	41%
IMG OID	637579715
Product	DNA ligase
Protein accession	YP_123348
Protein GI	54296979
COG category	[L] Replication, recombination and repair
COG ID	[COG0272] NAD-dependent DNA ligase (contains BRCT domain type II)
TIGRFAM ID	[TIGR00575] DNA ligase, NAD-dependent

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATGATC AAGGAATTAA GGAATCGATA GAAACGCTTA AAGAGCAAAT AAGAAAATAC 
GATTATCACT ATTATGTTTT AGATGAACCT TTGGTTCCTG ACGCGGAATA TGATCGATGT 
TTCAAGGCAT TGCAACAGTA TGAAGAGCAA TATCCGCAAT TTTTATCGCC AGATTCCCCT 
ACACAGAGAG TGAGCGGTAC TCCTTCAGAT GCTTTTATGC CGGTAGCCCA TAAGCAACCC 
ATGTTGTCTT TATCCAATGT GTTTACTATC GATGAATTAA AAGCATTCAT TAAACGAGCA 
ATTGAGAAAC TGGATGAACC AAATCAACAA CTGGTATTTG CTTGCGAACC AAAGCTTGAT 
GGGTTGGCTG TTAACATGAC TTATGAGGGC GGGATCTTGA CTCATGCCGC AACTCGTGGC 
GATGGTGCTG TAGGAGAAAA CATCACGGCA AATATTAAGA CTATTGCTTC AGTTCCATTA 
AGGCTAAGGG TTAGTAACCC TCCAAAATTG ATCGAAGTGC GGGGTGAAGT CTATATCCCC 
AAAGCCGATT TTGAAGCTTA CAACGCAAGG GCTAGAGAAC TCGGTGAAAA AACTTTTGCT 
AATCCGCGAA ATGCTGCTGC AGGCAGTTTA AGACAATTAA ATCCTGAAAT TTCTGCCAGT 
CGTCCACTTG CTATTTATTG TTATAGTATA GGGGCTTGCG AGGATTATAA GTTACCTAAC 
AGTCATTTGG AGCAATTGAA TTTATTAAAA GAGTTTGGAT TTAGAGTGTC TCCAGAAACG 
AGGAGGGCGA TTGGAGTAGA AGGCTGTTTA GATTATTACC AGTATATGTT AGCGAAACGG 
AATCAATTGC CATTTGAAAT CGATGGGGTT GTTTATAAGA TTGACAGTAT CTCCTTGCAA 
CAGCAATTAG GTTATGTTTC TCGTGCCCCA AGATTTGCTT GTGCCCATAA ATTTCCCGCT 
ACAGAAGAAA TGACTCGTCT GATAGCCGTG GATTTCCAGG TAGGTAGAAC GGGTGCTGTG 
ACGCCGGTTG CACGTTTGGA GCCAGTTAGT GTTGGTGGTG TTACAGTAAG TAACGCGACT 
TTGCATAATT TTGATGAAAT TACACGAAAA GACATTCGTA TTGGTGATAC GGTTATTATT 
CGTCGTGCCG GTGATGTGAT CCCTGAAGTA GTTTCTGTGA TTTTGGAAAA GCGTCCCATT 
AATGCCAGAA AGATTGAGCT TCCTAAAAAT TGCCCTGTTT GTGGTTCTGA AGTCGTAAGG 
GAAGCGGATG AAGCAATTGC TCGGTGTATC GGCGGTTTAT ATTGTAAAGC ACAATTAAAA 
AGGATGATGT GGCATTTTGC TTCTCGAAAA GCGATGTATA TTGAAGGACT TGGTAGTGTT 
TTAATTGATC AGTTAGTTGA TGAGGGTATT GTCCATCATT TGGCGGATCT TTATGAACTC 
GATTTGCAGA CTTTAGCTAA CCTGCCAAGG ATGGGGGAGA AATCTGCAAA AAACTTATTA 
TCCGCTTTGG AAAAAAGTAA AAAAACGACT TTCAATCGCT TTCTTTATGC TTTGGGGATC 
AGAGAAATCG GTGAAGCTGG CGCAAGGGTT TTAGCGGAGC ACTACTGTGA TGTAGAGAGC 
TTGAAATCAG CAACGATTGA GGAATTAATG ACTCTGAATG ACATAGGTCC AGTAGCGGCT 
TCTCATGTAG TCCATTTCTT TGCTCAAGCG CATAATCTTG AAGTGATTGA CCGTCTTCTC 
GAGTTGGGTA TTCATTGGCC TAAGCCCGAA AAAATACAGG TTAATCAGCA AAATCCATTT 
TTTGGTAAAA CAGTAGTTTT AACTGGAACT CTGAGTGCCA TGGGGAGGGA AGAGGCAAAG 
GCAAAATTAT TAGCCTTAGG TGCAAAAGTG AGTGGAAGTG TGTCTTCCAA AACGGATTAT 
GTAATAGCAG GAAGTGAAGC CGGTTCAAAG CTGATTAAAG CGACAGAACT GGGAGTAGCG 
ATTATAGAGG AAGACGAGTT TTTAAAATGG GTTAATTCAT GA

Protein sequence

MNDQGIKESI ETLKEQIRKY DYHYYVLDEP LVPDAEYDRC FKALQQYEEQ YPQFLSPDSP 
TQRVSGTPSD AFMPVAHKQP MLSLSNVFTI DELKAFIKRA IEKLDEPNQQ LVFACEPKLD 
GLAVNMTYEG GILTHAATRG DGAVGENITA NIKTIASVPL RLRVSNPPKL IEVRGEVYIP 
KADFEAYNAR ARELGEKTFA NPRNAAAGSL RQLNPEISAS RPLAIYCYSI GACEDYKLPN 
SHLEQLNLLK EFGFRVSPET RRAIGVEGCL DYYQYMLAKR NQLPFEIDGV VYKIDSISLQ 
QQLGYVSRAP RFACAHKFPA TEEMTRLIAV DFQVGRTGAV TPVARLEPVS VGGVTVSNAT 
LHNFDEITRK DIRIGDTVII RRAGDVIPEV VSVILEKRPI NARKIELPKN CPVCGSEVVR 
EADEAIARCI GGLYCKAQLK RMMWHFASRK AMYIEGLGSV LIDQLVDEGI VHHLADLYEL 
DLQTLANLPR MGEKSAKNLL SALEKSKKTT FNRFLYALGI REIGEAGARV LAEHYCDVES 
LKSATIEELM TLNDIGPVAA SHVVHFFAQA HNLEVIDRLL ELGIHWPKPE KIQVNQQNPF 
FGKTVVLTGT LSAMGREEAK AKLLALGAKV SGSVSSKTDY VIAGSEAGSK LIKATELGVA 
IIEEDEFLKW VNS