Gene Rleg2_4891 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_4891
Symbol
ID	6977985
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011368
Strand	-
Start bp	529629
End bp	531095
Gene Length	1467 bp
Protein Length	488 aa
Translation table	11
GC content	66%
IMG OID	643394048
Product	Aldehyde Dehydrogenase
Protein accession	YP_002278866
Protein GI	209546948
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.364964
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.705807
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGGGTG AAACGGTGTT TTCGGCAAAG CTGATGATCA ACAACGAGGC GCTGGATGCT 
TCCGAAAGGG CGACCTTCGA ACGCATCGAT CCGCTGAGCG GCGATGTCGC AACGATTGCT 
TCGGCGGGAT CCATCGCCGA CATGACGCGG GCAGCCAATG CCGCCGCTGC CGCCTTTCCC 
GACTGGTCGC AGACCGGGCC GGGCGAACGG CGCTGGCTGC TGAATGCCGC GGCCGATCTG 
CTGGAGGCCC GCACGCCGGA ACTCATTGCC GCCATGACCG GCGAAACCGG CGCCACGGCG 
CAATGGGCGG CGATCAATTG CGGGCTCGGC GCCGATATCT TTCGCGAGGC GGCGGCGATG 
ACCACGCAAA TCTCAGGCGA GCTCATTCCG TCAGGCATTC CCGGCAGCCT CGCCATGGCG 
GTGCGCCAGC CGGCCGGCGT CTGCGTCGGC ATCGCCCCCT GGAATGCGCC GGTCATTCTC 
GGCGCCCGCG CCGTCGCCAT GCCGCTTGCC TGCGGCAACA CCGTCGTGCT CAAGGCCTCG 
GAACTCTGCC CGAAGACCCA CGGCCTGATC GGCGATATCC TGCGTGACGC CGGTTTTCCG 
CGCGGCGTCG TCAATGTCGT TTCCAATGCG CCGAGCGATG CCGCTGCGGT CGTCGATGCG 
CTGATCGCCC ATCCGGCCGT GCGCCGCATC AATTTCACCG GCTCCACCCG TGTCGGCCGG 
ATCATCGCCG AAAGCGCAGC ACGACATCTG AAGCGCTGCC TGCTCGAACT CGGCGGCAAG 
GCGCCGTTCA TCGTGCTGGC CGACGCCGAT ATCGACGAGG CGGTCGGTGC CGCCGCCTTC 
GGCGCCTTCA TGAACCAGGG CCAGATCTGC ATGTCCACCG AGCGGATCAT CCTGATGGAC 
GAGATCGCCG ACGGCTTCGT CGGCAAGTTT CGGACGAGAG CCGCAACCCT CGTTGCAGGC 
CACCCCGGAG ACGGCAACAC GCCGCTCGGC ACGCTGATCA ACGCAGAGGC CGTGCGCCGC 
GTCAGGTCGC TGATCGACGA TGCCTTGCAG AAGGGCGCGG TCCTCCTCTG CGGCGGCGAG 
GCCCACGGCA CGCTGATGGA TGCGACCGTC ATCGATCACG TCACCCCTGC CATGCGCGTC 
TACCGCGAGG AGAGCTTCGG GCCGGTCGCG GCAATCATCC GAGTCGGCAG CGTCGACGAG 
GCCGTGACGG TCGCCAACGA CAACGAATAT GGGCTTTCGG CGGCGGTGTT CAGCGCCGAT 
GTCAATGCGG CCTTGGCCGT CGCCATGCGG CTTGAATCCG GCATCTGCCA CATCAACGAG 
GCGACGGTTT CCGATGAGCC GCAAATGCCG TTCGGCGGCG TCAAATCGAG CGGCTACGGC 
CGCTTCGGCG GCAAGGCGGC GATCGATGAA TTCACCGAGC TCCGATGGCT CACCATCGCA 
TCGGGAAAAC GGCAATACCC GATCTGA

Protein sequence

MRGETVFSAK LMINNEALDA SERATFERID PLSGDVATIA SAGSIADMTR AANAAAAAFP 
DWSQTGPGER RWLLNAAADL LEARTPELIA AMTGETGATA QWAAINCGLG ADIFREAAAM 
TTQISGELIP SGIPGSLAMA VRQPAGVCVG IAPWNAPVIL GARAVAMPLA CGNTVVLKAS 
ELCPKTHGLI GDILRDAGFP RGVVNVVSNA PSDAAAVVDA LIAHPAVRRI NFTGSTRVGR 
IIAESAARHL KRCLLELGGK APFIVLADAD IDEAVGAAAF GAFMNQGQIC MSTERIILMD 
EIADGFVGKF RTRAATLVAG HPGDGNTPLG TLINAEAVRR VRSLIDDALQ KGAVLLCGGE 
AHGTLMDATV IDHVTPAMRV YREESFGPVA AIIRVGSVDE AVTVANDNEY GLSAAVFSAD 
VNAALAVAMR LESGICHINE ATVSDEPQMP FGGVKSSGYG RFGGKAAIDE FTELRWLTIA 
SGKRQYPI