Gene ECH74115_3642 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_3642
Symbol	ligA
ID	6969635
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	3356657
End bp	3358672
Gene Length	2016 bp
Protein Length	671 aa
Translation table	11
GC content	54%
IMG OID	643387437
Product	NAD-dependent DNA ligase LigA
Protein accession	YP_002271890
Protein GI	209399429
COG category	[L] Replication, recombination and repair
COG ID	[COG0272] NAD-dependent DNA ligase (contains BRCT domain type II)
TIGRFAM ID	[TIGR00575] DNA ligase, NAD-dependent

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.0000402344
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	60
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAATCAA TCGAACAACA ACTGACAGAA CTGCGAACGA CGCTTCGCCA TCATGAATAT 
CTTTATCATG TGATGGATGC GCCGGAAATT CCCGACGCTG AATACGACAG GCTGATGCGC 
GAACTGCGCG AGCTGGAAAC CAAACATCCA GAACTGATTA CGCCTGATTC GCCTACCCAA 
CGTGTAGGTG CTGCGCCGCT GGCGGCTTTC AGCCAGATTC GCCATGAAGT GCCAATGCTG 
TCGCTGGATA ACGTTTTTGA TGAAGAAAGC TTTCTTGCCT TCAACAAACG TGTGCAGGAC 
CGTCTGAAAA GCAACGAGAA AGTCACCTGG TGCTGTGAGC TGAAGCTGGA TGGCCTTGCC 
GTCAGTATTC TGTATGAAAA TGGCGTTTTA GTCAGTGCCG CGACTCGTGG CGATGGCACC 
ACCGGGGAAG ATATCACGTC TAATGTGCGT ACTATTCGCG CCATTCCACT GAAGTTGCAC 
GGAGAGAATA TCCCGGCGCG TCTGGAAGTG CGTGGTGAAG TGTTCCTGCC GCAGGCGGGG 
TTCGAAAAGA TTAACGAAGA TGCGCGACGC ACGGGCGGGA AAGTGTTTGC TAACCCACGT 
AATGCGGCAG CTGGTTCACT GCGTCAGCTT GATCCGCGTA TTACAGCGAA GCGACCGCTC 
ACTTTTTTCT GCTATGGCGT TGGTGTTCTG GAAGGTGGCG AGCTGCCGGA TACTCATCTT 
GGCCGTTTAC TGCAATTTAA AAAGTGGGGG TTGCCGGTCA GCGATCGGGT AACGCTTTGT 
GAATCGGCGG AAGAAGTGCT GGCGTTCTAT CACAAAGTGG AAGAAGACCG CCCGACGCTG 
GGCTTTGATA TCGACGGCGT GGTGATTAAG GTCAACTCAC TGGAACAGCA GGAGCAGCTT 
GGCTTTGTCG CGCGAGCCCC GCGCTGGGCG GTAGCGTTTA AATTCCCGGC GCAGGAACAG 
ATGACCTTTG TGCGTGACGT CGAGTTTCAG GTTGGGCGTA CTGGCGCGAT TACGCCTGTT 
GCGCGTCTGG AACCTGTCCA TGTTGCAGGC GTGCTGGTGA GTAACGCAAC CTTACACAAT 
GCGGATGAAA TCGAACGTCT TGGTTTACGC ATTGGCGATA AAGTGGTGAT TCGCCGCGCT 
GGCGACGTGA TCCCGCAGGT GGTTAACGTC GTGCTTTCTG AACGCCCGGA AGATACCCGT 
GAGGTTGTAT TCCCGACGTA TTGTCCGGTA TGTGGTTCTG ACGTTGAGCG TGTGGAAGGT 
GAAGCGGTTG CCCGCTGTAC TGGTGGTCTG ATTTGCGGTG CGCAGCGTAA AGAGTCGCTG 
AAACACTTTG TTTCCCGCCG TGCGATGGAT GTTGACGGAA TGGGCGACAA AATCATCGAT 
CAGCTGGTTG AAAAAGAATA TGTCCACACT CCGGCGGATC TGTTCAAACT CACCGCAGGC 
AAACTGACCG GACTGGAGCG TATGGGGCCA AAATCGGCAC AAAACGTGGT TAACGCGCTG 
GAAAAAGCGA AAGAAACCAC CTTTGCTCGC TTCCTCTATG CACTTGGCAT CCGTGAAGTC 
GGCGAGGCCA CCGCAGCAGG TCTGGCGGCA TATTTCGGAA CGCTGGAAGC GCTGGAAGCC 
GCTTCGATTG AAGAGCTGCA AAAGGTGCCT GATGTTGGCA TTGTCGTTGC ATCCCACGTT 
CACAACTTCT TTGCCGAAGA AAGCAACCGC AATGTCATCA GCGAGCTGTT GGCGGAAGGT 
GTTCACTGGC CTGCGCCGAT CGTTATCAAC GCGGAAGAGA TTGACAGCCC GTTTGCTGGT 
AAAACCGTGG TGCTTACGGG CAGCTTAAGC CAGATGTCGC GTGATGACGC TAAAGCTCGA 
CTGGTCGAAC TGGGCGCGAA AGTCGCGGGC AGCGTGTCGA AGAAAACCGA TCTGGTGATA 
GCGGGTGAAG CTGCAGGATC TAAACTGGCG AAGGCGCAGG AACTGGGCAT TGAAGTCATC 
GACGAAGCGG AAATGCTGCG TTTGCTGGGT AGCTGA

Protein sequence

MESIEQQLTE LRTTLRHHEY LYHVMDAPEI PDAEYDRLMR ELRELETKHP ELITPDSPTQ 
RVGAAPLAAF SQIRHEVPML SLDNVFDEES FLAFNKRVQD RLKSNEKVTW CCELKLDGLA 
VSILYENGVL VSAATRGDGT TGEDITSNVR TIRAIPLKLH GENIPARLEV RGEVFLPQAG 
FEKINEDARR TGGKVFANPR NAAAGSLRQL DPRITAKRPL TFFCYGVGVL EGGELPDTHL 
GRLLQFKKWG LPVSDRVTLC ESAEEVLAFY HKVEEDRPTL GFDIDGVVIK VNSLEQQEQL 
GFVARAPRWA VAFKFPAQEQ MTFVRDVEFQ VGRTGAITPV ARLEPVHVAG VLVSNATLHN 
ADEIERLGLR IGDKVVIRRA GDVIPQVVNV VLSERPEDTR EVVFPTYCPV CGSDVERVEG 
EAVARCTGGL ICGAQRKESL KHFVSRRAMD VDGMGDKIID QLVEKEYVHT PADLFKLTAG 
KLTGLERMGP KSAQNVVNAL EKAKETTFAR FLYALGIREV GEATAAGLAA YFGTLEALEA 
ASIEELQKVP DVGIVVASHV HNFFAEESNR NVISELLAEG VHWPAPIVIN AEEIDSPFAG 
KTVVLTGSLS QMSRDDAKAR LVELGAKVAG SVSKKTDLVI AGEAAGSKLA KAQELGIEVI 
DEAEMLRLLG S