Gene EcHS_A3858 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3858
Symbol	ligB
ID	5592937
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	3849071
End bp	3850759
Gene Length	1689 bp
Protein Length	562 aa
Translation table	11
GC content	53%
IMG OID	640922968
Product	NAD-dependent DNA ligase LigB
Protein accession	YP_001460446
Protein GI	157163128
COG category	[L] Replication, recombination and repair
COG ID	[COG0272] NAD-dependent DNA ligase (contains BRCT domain type II)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	58
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGATGATGA AAGTATGGAT GGCGATATTA ATAAGTATCT TGTGCTGGCA ATCATCTGTG 
TGGGCGGTCT GTCCGGCCTG GTCGCCAGCC AGAGCACAGG AAGAAATTTC CCGCCTGCAA 
CAGCAAATAA AACAGTGGGA CGATGTCTAC TGGAAGGAAG GAAAAAGTGA GGTGGAAGAC 
GGTGTTTACG ATCAGTTAAG CGCCCGTCTT ACGCAGTGGC AACGCTGCTT TGGGAGCGAG 
CCCCGCGACG TGATGATGCC GCCTTTAAAT GGTGCGGTTA TGCATCCGGT TGCCCATACG 
GGTGTACGCA AAATGGTGGA TAAAAACGCA TTAAGTCTGT GGATGCGAGA ACGTAGCGAT 
CTTTGGGTGC AGCCAAAAGT TGATGGCGTT GCGGTAACCC TGGTTTATCG GGACGGGAAA 
CTGAACAAAG CAATCAGTCG CGGTAATGGC CTGAAAGGCG AGGACTGGAC GCAGAAAGTT 
AGCTTAATTT CCGCTGTGCC GCAAACCGTT AGCGGGCCTT TAGCCAACAG TACGCTTCAG 
GGGGAAATAT TTCTCCAGCG CGAGGGGCAT ATCCAACAAC AAATGGGGGG AATAAATGCC 
CGCGCAAAAG TTGCTGGCTT GATGATGCGC CAGGACGATA GCGACACGCT GAATTCTCTG 
GGCGTTTTTG TCTGGGCATG GCCGGATGGA CCGCAGTTAA TGTCTGATCG TTTAAAAGAG 
CTGGCTACCG CAGGTTTTAC TCTAACGCAG ACGTATACCC GTGCGGTGAA AAATGCTGAT 
GAAGTTGCGC GCGTACGCAA TGAGTGGTGG AAAGCGGAAT TACCCTTCGT CACCGATGGC 
GTAGTTGTAC GAGCGGCGAA AGAGCCAGAA TCCCGCCATT GGCTACCGGG CCAGGCAGAG 
TGGCTGGTGG CCTGGAAATA TCAACCTGTA GCTCAGGTTG CCGAAGTGAA GGCAATTCAG 
TTTGCGGTGG GTAAGAGCGG TAAAATATCG GTGGTTGCGT CACTCGCACC TGTCATGCTG 
GATGATAAAA AAGTCCAGCG GGTGAATATT GGTTCCGTCA GGCGCTGGCA GGAGTGGGAT 
ATTGCGCCTG GTGATCAGAT TCTCGTCAGC CTTGCCGGTC AGGGTATTCC TCGCATTGAT 
GATGTGGTGT GGCGCGGTGC AGAACGTACA AAACCGACAC CGCCAGAAAA CCGCTTTAAC 
TCGTTGACCT GCTACTTTGC TTCTGATGTT TGTCAGGAAC AGTTCATTTC ACGCTTAGTC 
TGGCTGGGGG CAAAACAGGT TCTTGGGCTG GATGGCATTG GTGAGGCCGG CTGGCGCGCG 
CTGCATCAGA CTCATCGCTT TGAGCATATC TTTTCCTGGC TTTTATTAAC GCCAGAGCAA 
TTACAGAACA CGCCGGGGAT CGCGAAAAGT AAAAGTGCGC AGCTATGGCA TCAGTTTAAT 
CTGGCTCGTA AGCAGCCTTT TACTCGCTGG GTGATGGCAA TGGGAATACC GCTAACCCGG 
GCGGCGCTTA ATGCCAGTGA TGAACGGTCC TGGTCGCAAC TTTTATTTAG CACGGAGCAG 
TTCTGGCAGC AGCTGCCGGG CACTGGATCG GGGCGCGCCA GACAGGTTAT TGAATGGAAG 
GAAAATGCGC AAATCAAGAA GCTGGGCAGT TGGCTGGCTG CCCAGCAGAT CACAGGTTTT 
GAACCTTAG

Protein sequence

MMMKVWMAIL ISILCWQSSV WAVCPAWSPA RAQEEISRLQ QQIKQWDDVY WKEGKSEVED 
GVYDQLSARL TQWQRCFGSE PRDVMMPPLN GAVMHPVAHT GVRKMVDKNA LSLWMRERSD 
LWVQPKVDGV AVTLVYRDGK LNKAISRGNG LKGEDWTQKV SLISAVPQTV SGPLANSTLQ 
GEIFLQREGH IQQQMGGINA RAKVAGLMMR QDDSDTLNSL GVFVWAWPDG PQLMSDRLKE 
LATAGFTLTQ TYTRAVKNAD EVARVRNEWW KAELPFVTDG VVVRAAKEPE SRHWLPGQAE 
WLVAWKYQPV AQVAEVKAIQ FAVGKSGKIS VVASLAPVML DDKKVQRVNI GSVRRWQEWD 
IAPGDQILVS LAGQGIPRID DVVWRGAERT KPTPPENRFN SLTCYFASDV CQEQFISRLV 
WLGAKQVLGL DGIGEAGWRA LHQTHRFEHI FSWLLLTPEQ LQNTPGIAKS KSAQLWHQFN 
LARKQPFTRW VMAMGIPLTR AALNASDERS WSQLLFSTEQ FWQQLPGTGS GRARQVIEWK 
ENAQIKKLGS WLAAQQITGF EP