Gene Rleg2_4018 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_4018
Symbol
ID	6982788
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	+
Start bp	4188302
End bp	4189399
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	62%
IMG OID	643398747
Product	oxidoreductase domain protein
Protein accession	YP_002283506
Protein GI	209551589
COG category	[R] General function prediction only
COG ID	[COG0673] Predicted dehydrogenases and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGGTCA CGGGAAACAG TGACATGAGC ATCAGAACGG TCGCGATCGT CGGCTGCGGT 
ATCGGCCGCT CCCACATTGT CGAGGGTTAT CTGCCGCATG CCGACAAGTT CAAGGTCGTG 
GCGATCTGCG ACCTGAATGA GCAGCGCATG GCGTCAGTCG GCGACGAGTT CGGCATCGAG 
CGGCGCACCA CCTCCTTTGC GGAGTTGCTC GCCGACGAAA CGATCGACAT CATCGATATC 
TGCACTCCGC CCGGCATCCA TCTGGAACAG GTGGTGGCTG CCCTCGCTGC CGGCAAACAT 
GTCGTTTGCG AAAAGCCGCT GACCGGCTCG CTTGCCGCCG TCGATACGAT CATGGCAGCG 
GAGAAAGCCG CCAAAGGCGT GCTGATGCCG ATCTTCCAGT ATCGCTACGG CGACGGCATC 
CAGAAGGCCA AGCGGATTAT CGACGCCGGC ATTGCCGGCA AGGCCTACAC GGCTTCGGTC 
GAAACCTTCT GGCTGCGCAA GCCCGAATAT TACGCCGTGC CCTGGCGCGG CAAATGGGCG 
ACGGAACTCG GCGGCGTGCT CGTCACCCAT GCGCTGCATC TGCACGACAT GATGATGCAT 
CTGATGGGGC CGGCGGCAAG GGTCTTCGGC CGTGTCGCCA CCCGCGTCAA CGATATCGAG 
GTCGAGGATT GCGCCTCCGC CAGCCTGCTG ATGGAAAGCG GCGCCTTCGT CTCGCTGTCC 
TGCACGCTGG GTTCGCAGGA ACAGTTGAGC CGGCTGAGGC TGCACTTCGA GAATGTTACC 
TTCGAAAGCA GCCATGAGCC CTATACGCCA GGTAAGGATC CTTGGAAGAT CATCGCCGCC 
AATGACGACG TGCAGGCAAA GATCGACCGG GTGATCAGCG ACTGGCAGCC GGTCGCGCCG 
CGTTTCACTA CCCAGATGGG CCAGTTTCAC GCCTTCCTCA GCGGCCATGG GCCGCTGCCG 
GTGACGACGG TGGATGCACG CCGCGCGCTG GAACTCGTCA CCGCCATCTA CCAGTCTTCC 
GACAGCGGCG CCGAAGTGCC GCTGCCGGTC GGCCCGGACA GTCCGAAATA CGTCGATTGG 
CGTGCAAGAA CGAAGTAA

Protein sequence

MAVTGNSDMS IRTVAIVGCG IGRSHIVEGY LPHADKFKVV AICDLNEQRM ASVGDEFGIE 
RRTTSFAELL ADETIDIIDI CTPPGIHLEQ VVAALAAGKH VVCEKPLTGS LAAVDTIMAA 
EKAAKGVLMP IFQYRYGDGI QKAKRIIDAG IAGKAYTASV ETFWLRKPEY YAVPWRGKWA 
TELGGVLVTH ALHLHDMMMH LMGPAARVFG RVATRVNDIE VEDCASASLL MESGAFVSLS 
CTLGSQEQLS RLRLHFENVT FESSHEPYTP GKDPWKIIAA NDDVQAKIDR VISDWQPVAP 
RFTTQMGQFH AFLSGHGPLP VTTVDARRAL ELVTAIYQSS DSGAEVPLPV GPDSPKYVDW 
RARTK