Gene EcHS_A2546 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A2546
Symbol	ligA
ID	5593256
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	2555725
End bp	2557740
Gene Length	2016 bp
Protein Length	671 aa
Translation table	11
GC content	55%
IMG OID	640921667
Product	NAD-dependent DNA ligase LigA
Protein accession	YP_001459194
Protein GI	157161876
COG category	[L] Replication, recombination and repair
COG ID	[COG0272] NAD-dependent DNA ligase (contains BRCT domain type II)
TIGRFAM ID	[TIGR00575] DNA ligase, NAD-dependent

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	6.01558e-16
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAATCAA TCGAACAACA ACTGACAGAA CTGCGAACGA CGCTTCGCCA TCATGAATAT 
CTTTATCATG TGATGGATGC GCCGGAAATT CCCGACGCTG AATACGACAG GCTGATGCGC 
GAACTGCGCG AGCTGGAAAC CAAACATCCA GAACTGATTA CGCCTGATTC GCCTACCCAA 
CGTGTAGGTG CTGCGCCGCT GGCGGCTTTC AGCCAGATTC GCCATGAAGT GCCAATGCTG 
TCGCTGGATA ACGTTTTTGA TGAAGAAAGC TTTCTTGCCT TCAACAAACG AGTGCAGGAC 
CGTCTGAAAA GCAACGAGAA AGTCACCTGG TGCTGTGAGC TGAAGCTGGA TGGCCTTGCT 
GTCAGTATTC TGTATGAAAA TGGCGTTTTA GTCAGTGCCG CGACCCGTGG CGATGGCACC 
ACCGGGGAAG ATATCACGTC TAACGTGCGT ACCATTCGCG CCATTCCACT GAAGCTACAC 
GGAGAGAATA TCCCGGCGCG TCTGGAAGTG CGTGGTGAAG TGTTCCTGCC GCAGGCGGGG 
TTCGAAAAGA TTAACGAAGA TGCGCGACGC ACGGGCGGGA AAGTTTTTGC TAACCCACGT 
AATGCGGCAG CTGGTTCACT GCGTCAGCTT GATCCGCGTA TTACAGCGAA GCGACCGCTC 
ACTTTTTTCT GCTATGGCGT TGGTGTTCTG GAAGGTGGCG AGCTGCCGGA TACTCATCTT 
GGCCGTTTAC TGCAATTTAA ACAGTGGGGG TTGCCGGTCA GCGATCGGGT AACGCTTTGT 
GAATCGGCGG AAGAAGTGCT GGCGTTCTAT CACAAAGTGG AAGAAGACCG CCCGACGCTG 
GGCTTTGATA TCGACGGCGT GGTGATTAAG GTCAACTCAC TGGCACAGCA GGAGCAGCTT 
GGCTTTGTCG CGCGTGCCCC GCGCTGGGCG GTAGCGTTTA AATTCCCGGC GCAGGAGCAG 
ATGACCTTTG TGCGTGACGT CGAGTTTCAG GTTGGGCGTA CTGGCGCGAT TACGCCTGTT 
GCGCGTCTGG AACCTGTCCA TGTTGCAGGC GTGCTGGTGA GTAACGCAAC CTTACACAAT 
GCGGATGAAA TCGAACGTCT TGGTTTACGC ATTGGCGATA AAGTGGTGAT TCGCCGCGCT 
GGCGACGTGA TCCCGCAGGT GGTTAACGTC GTGCTTTCTG AACGCCCGGA AGATACCCGT 
GAGGTTGTAT TCCCGACGCA TTGTCCGGTA TGTGGTTCTG ACGTTGAGCG TGTGGAAGGT 
GAAGCGGTTG CCCGCTGTAC CGGTGGCCTG ATTTGCGGTG CGCAGCGTAA AGAGTCGCTG 
AAACACTTTG TTTCCCGCCG TGCGATGGAT GTTGACGGAA TGGGCGACAA AATCATCGAT 
CAGCTGGTTG AAAAAGAATA TGTCCATACT CCGGCAGATC TGTTCAAACT CACCGCAGGC 
AAACTGACCG GACTGGAGCG TATGGGGCCA AAATCGGCAC AAAACGTGGT TAACGCGCTG 
GAAAAAGCGA AAGAAACCAC CTTTGCTCGC TTCCTCTATG CACTTGGCAT CCGTGAAGTC 
GGCGAGGCCA CCGCAGCAGG TCTGGCGGCA TATTTCGGCA CGCTGGAAGC GCTGGAAGCC 
GCTTCGATTG AAGAGCTGCA AAAGGTGCCT GATGTTGGCA TTGTCGTTGC ATCCCACGTT 
CACAACTTCT TTGCCGAAGA AAGCAACCGC AATGTCATCA GCGAGCTGTT GGCGGAAGGT 
GTTCACTGGC CTGCGCCGAT CGTTATCAAC GCGGAAGAGA TTGACAGCCC GTTTGCTGGT 
AAAACCGTGG TGCTTACGGG CAGCTTAAGC CAGATGTCGC GTGATGACGC TAAAGCTCGA 
CTGGTCGAAC TGGGCGCGAA AGTCGCGGGC AGCGTGTCGA AGAAAACCGA TCTGGTGATA 
GCGGGTGAAG CTGCAGGATC TAAACTGGCG AAGGCGCAGG AACTGGGCAT TGAAGTCATC 
GACGAAGCGG AAATGCTGCG TTTGCTGGGT AGCTGA

Protein sequence

MESIEQQLTE LRTTLRHHEY LYHVMDAPEI PDAEYDRLMR ELRELETKHP ELITPDSPTQ 
RVGAAPLAAF SQIRHEVPML SLDNVFDEES FLAFNKRVQD RLKSNEKVTW CCELKLDGLA 
VSILYENGVL VSAATRGDGT TGEDITSNVR TIRAIPLKLH GENIPARLEV RGEVFLPQAG 
FEKINEDARR TGGKVFANPR NAAAGSLRQL DPRITAKRPL TFFCYGVGVL EGGELPDTHL 
GRLLQFKQWG LPVSDRVTLC ESAEEVLAFY HKVEEDRPTL GFDIDGVVIK VNSLAQQEQL 
GFVARAPRWA VAFKFPAQEQ MTFVRDVEFQ VGRTGAITPV ARLEPVHVAG VLVSNATLHN 
ADEIERLGLR IGDKVVIRRA GDVIPQVVNV VLSERPEDTR EVVFPTHCPV CGSDVERVEG 
EAVARCTGGL ICGAQRKESL KHFVSRRAMD VDGMGDKIID QLVEKEYVHT PADLFKLTAG 
KLTGLERMGP KSAQNVVNAL EKAKETTFAR FLYALGIREV GEATAAGLAA YFGTLEALEA 
ASIEELQKVP DVGIVVASHV HNFFAEESNR NVISELLAEG VHWPAPIVIN AEEIDSPFAG 
KTVVLTGSLS QMSRDDAKAR LVELGAKVAG SVSKKTDLVI AGEAAGSKLA KAQELGIEVI 
DEAEMLRLLG S