Gene Rleg2_4457 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_4457
Symbol
ID	6977551
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011368
Strand	-
Start bp	89730
End bp	91136
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	63%
IMG OID	643393635
Product	Aldehyde Dehydrogenase
Protein accession	YP_002278453
Protein GI	209546535
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.399001
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.0106481
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAGCAGT CTACCCTGCT CATCGGTGGC GAAACTGTCG CCACCGCCCA GCATGCGCCG 
GTCACAAATC CGTCGAACGG CGAAATTGTC GGCTATATGC CGCTTGCCGG GCAAGACGAT 
CTCGACCGTG CCGTTGCCGC CGCAGCCGCG GCTTTCAAAA GCTGGTCGCA GACCTCGAAT 
GAACAGCGCG CCGGAGCCTG CCGCGCCATA GCGGAAAAGA TCAGCGAGCA CGCCGAGGAA 
TTGGCGCAGC TCCTGACCCG GGAGCAGGGT AAGCCGCTCA ACGGCCTCGG GTCGCGTTTT 
GAAATCGGCG GCGCACTTGC CTGGACGCGC CATACGGCGG AACTCGATCT GCCGGTCGAG 
ATCCTGCAGG ATGACAATGA GGGCCGCGTC GAGCTGCACC GCAAGCCGAT TGGCGTTGTC 
GGTTCGATCA CACCCTGGAA CTGGCCCGTC ATGATCGCCT GCTGGCACAT CGTGCCGGCG 
GTGCGGGCCG GCAATACCGT GGTCATCAAG CCATCGCCCC TGACGCCGCT CTCGACCATC 
CGCCTGGTCG AGATCATCAA CCAGGTGCTG CCGGCCGGCG TCGTCAATGT GATCACTGGG 
GAAAACAGCA TTGGAGCCGC GCTTTCGGCC CATCCCGGTA TTGCCAAGAT GACCTTCACC 
GGCTCGACCG AGACGGGCAA GAAAATCATG GCCTCGGCCG TCGCCACCTT GAAGCGGCTG 
ACGCTGGAGC TCGGCGGCAA TGATGCGGGC ATCGTGCTGC CCGACGTCGA TCCGAAAGGC 
GTCGCCGAGG GTCTGTTCTG GGGCGCCTTC ATCAATAACG GCCAGACCTG CGCGGCGCTG 
AAACGCCTCT ATGTGCATGA CAGCATCTAT GAGGAGGTCT GCGCGGCACT TGCCGATTAC 
GCCGGAAAGA TCACCGTCGG CGACGGCCTG GATGAGGCCA GCATCCTCGG GCCGATACAG 
AACGAAATAC AGTTCAACAA AGTGCGCGAT CTCGTCGACG ATGCGCGCAC TCAGGGCGGC 
CGCATCCTGA CCGGCGGCGC GCCGCTGGAC CGGCCCGGCT ATTTCTATCC GATCACCCTC 
GTTGCCGATG TCGATCATGG TGTGCGCCTG GTCGATGAGG AGCAGTTCGG CCCGGCCCTG 
CCGATCATTC GCTACAGCGA TCTCGACGAG GTGATCGCCC GCGCCAACCA GAATCCGGCC 
GGTCTCGGCG GCTCGGTCTG GTCTGCCGAC GTCGAGAAGG CCAAGCGTTA TGCGAGGCAG 
CTCGAATGCG GCTCGGTCTG GATCAACAAA CACGGCGCGA TCCAGCCCAA CGCGCCCTTC 
GGCGGCGTCA AACAATCCGG CATCGGCGTC GAATTCGGCG CCGAAGGCCT GAAGGAATTC 
ACCACGATCC AGACGGTGTT GAGCTGA

Protein sequence

MKQSTLLIGG ETVATAQHAP VTNPSNGEIV GYMPLAGQDD LDRAVAAAAA AFKSWSQTSN 
EQRAGACRAI AEKISEHAEE LAQLLTREQG KPLNGLGSRF EIGGALAWTR HTAELDLPVE 
ILQDDNEGRV ELHRKPIGVV GSITPWNWPV MIACWHIVPA VRAGNTVVIK PSPLTPLSTI 
RLVEIINQVL PAGVVNVITG ENSIGAALSA HPGIAKMTFT GSTETGKKIM ASAVATLKRL 
TLELGGNDAG IVLPDVDPKG VAEGLFWGAF INNGQTCAAL KRLYVHDSIY EEVCAALADY 
AGKITVGDGL DEASILGPIQ NEIQFNKVRD LVDDARTQGG RILTGGAPLD RPGYFYPITL 
VADVDHGVRL VDEEQFGPAL PIIRYSDLDE VIARANQNPA GLGGSVWSAD VEKAKRYARQ 
LECGSVWINK HGAIQPNAPF GGVKQSGIGV EFGAEGLKEF TTIQTVLS