Gene Rleg2_4442 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_4442
Symbol
ID	6977536
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011368
Strand	+
Start bp	75335
End bp	76315
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	62%
IMG OID	643393620
Product	3,4-dihydroxyphenylacetate 2,3-dioxygenase
Protein accession	YP_002278438
Protein GI	209546520
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0346] Lactoylglutathione lyase and related lyases
TIGRFAM ID	[TIGR02295] 3,4-dihydroxyphenylacetate 2,3-dioxygenase

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.266673
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCACTGC CGACACCCAA TCTCTATCCG CCCTTCAACA TCGTGCGTCT CAGCCATGTC 
GAACTCGGCG TCACCGATCT CGCCAAGTCC CGCGCCTTCT ATGTCGATAC GCTCGGCCTG 
CAGGTGACGG ATGAGACCGC CGATACCATC TATCTCAGGG CGCTCGAAGA ACGCGGCCAT 
CATTGCATCG TGCTGAAGAA ATCCGGCAAG GCCGAAGCCC GCGACCTTGG TTTCAAGGTC 
TTCGGCGACG AGGATCTCGA CAAGGCCGCC CACTTCTTCA AGGACAAGGG CCTGCCTGTG 
GAATGGGTCG AGCGCCCCTA TCAGGCGCGC ACCTTCCGCA CCCGCGATCC CCACGGCATT 
CCGCTCGAAT TCTATTCGAA GATGGACCGC CTGCCGCCGA TCCACCAGAA ATATGCGCTC 
TACAAGGGCG TCAAGCCGCT GCGCATCGAC CACTTCAACT GCTTCTCGCC GAATGTCGAC 
GAAAGTGTCG CCTTCTATAA CGAGCTCGGC TTCCGCGTCA CCGAATATAC CGAGGATGCC 
GAGACCGGCC GTCTCTGGGC CGCTTGGACG CACCGCAAGG GCGGCGTGCA CGACATCGCC 
TTCACCAACG GCCGCGGTCC GCGCCTGCAC CACACCGCCT TCTGGGTGCC GACGCCGCTC 
AACATCATCG ACCTGCTGGA TCTGATGGCG ACCACCGGCT GGGTCTCCAA CATCGAGCGC 
GGCCCCGGCC GCCACGGCAT CTCCAACGCC TTCTTCCTCT ACATCCTCGA TCCCGACGGC 
CACCGCATCG AGATCTACTG CTCGGACTAC CAGACGGTCG ATCCCGATCT GGAGCCGATC 
AGGTGGGACC TCAAGGATCC GCAGCGCCAG ACACTTTGGG GCGCACCGGC TCCCAAATCC 
TGGTTCGAAC ATGGTAGCCT GTTTGCCGGC GCCGATGTGG TCGAGCCTGA TCTGAAGGCA 
CAGCCGATCA TCGCGCCTTG A

Protein sequence

MPLPTPNLYP PFNIVRLSHV ELGVTDLAKS RAFYVDTLGL QVTDETADTI YLRALEERGH 
HCIVLKKSGK AEARDLGFKV FGDEDLDKAA HFFKDKGLPV EWVERPYQAR TFRTRDPHGI 
PLEFYSKMDR LPPIHQKYAL YKGVKPLRID HFNCFSPNVD ESVAFYNELG FRVTEYTEDA 
ETGRLWAAWT HRKGGVHDIA FTNGRGPRLH HTAFWVPTPL NIIDLLDLMA TTGWVSNIER 
GPGRHGISNA FFLYILDPDG HRIEIYCSDY QTVDPDLEPI RWDLKDPQRQ TLWGAPAPKS 
WFEHGSLFAG ADVVEPDLKA QPIIAP