Gene Rleg_5331 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_5331
Symbol
ID	8007399
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012848
Strand	+
Start bp	738176
End bp	739216
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	62%
IMG OID	644822236
Product	DNA polymerase LigD, ligase domain protein
Protein accession	YP_002973496
Protein GI	241113661
COG category	[L] Replication, recombination and repair
COG ID	[COG1793] ATP-dependent DNA ligase
TIGRFAM ID	[TIGR02776] DNA ligase D [TIGR02779] DNA polymerase LigD, ligase domain

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.51032
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCGCA CGCGCCGCCC ACTGCCCTTG CTCGACGAGT CTCACTCAAC GCTGCATTCT 
CGTCCGATCC GCAAACGCGA TCCTGACCAG CCCGGCCTGC CCTTCGATCC AATGCCGTCG 
CGCGTCGAGC CCTGCCTCGC GCTGCTGAAG CCGACTGTGC CCATTGGGCC GGATTGGCTC 
TATGAGGTGA AGCTGGATGG CTATCGATTG GCAATCCACG TTGAACCGAA GGGCGTGCGG 
GTCATCACCC GTGGCGGCCA TGACTGGACC CATCGCTTCC CCACCATCGC CGCGGCAGCG 
AAAGAGCTTG GCGTAACGAC CGCCATTCTC GATGGCGAGG CCGTTGTACT CGATGATAAC 
GGCCGATCGG ATTTTGGCGC CCTGCAGCGT TCGCTCGGCG GGCGGGGAGG CAAGCGAGTA 
TCGACCGAGT CGGTCCTCGT CGCCTTCGAC CTTCTCTATC TCGATGGACA CGATCTGACC 
GGCACCGAGC TTGACGTACG CCGACACCTG CTCGAAGACC TGATACCGGG CGGCGACGAT 
CAGACGATCC GCCTCTCCGA GCAGATAGAG CTGCCGGCCG AAGAACTCCT CGAGCACGCC 
TGCCATCATC ATCTGGAAGG TATCATCGCC AAGCATCGCG ACCGGCCCTA CGGCAGTGGC 
CGTACGGGCG ACTGGCTGAA GATCAAATGC GTCCAGAGCG AGAGCTTCAT GATCGTCGGT 
TATGAGCAGT CCGCATCCGC CCGCGGCGGC ATCGGCAGGC TATTGCTGGC CGGCAGACGA 
GGGCTCGACT GGATTTACGT TGGCTCCGTC GGAACTGGTT TCGGTGCCAG GGATGCTGAA 
TACCTGAAAA AGACGCTGGA CCGGTTAAAG ACGAACCGGC CGGTCGTTCC GCTGAATGGC 
AAGCGCCTCG TCCTCGTCCA GCCGACGCTG ATCGCTGAGA TCGAGTTTCG CGGCTGGACG 
GATGACGGCA ATCTCCGCCA TGCTTCGTAC AAGGGGCTGC GCGAGGTCCA GGATAATGCC 
GCAGTCTTCG ATATGACCTA A

Protein sequence

MKRTRRPLPL LDESHSTLHS RPIRKRDPDQ PGLPFDPMPS RVEPCLALLK PTVPIGPDWL 
YEVKLDGYRL AIHVEPKGVR VITRGGHDWT HRFPTIAAAA KELGVTTAIL DGEAVVLDDN 
GRSDFGALQR SLGGRGGKRV STESVLVAFD LLYLDGHDLT GTELDVRRHL LEDLIPGGDD 
QTIRLSEQIE LPAEELLEHA CHHHLEGIIA KHRDRPYGSG RTGDWLKIKC VQSESFMIVG 
YEQSASARGG IGRLLLAGRR GLDWIYVGSV GTGFGARDAE YLKKTLDRLK TNRPVVPLNG 
KRLVLVQPTL IAEIEFRGWT DDGNLRHASY KGLREVQDNA AVFDMT