Gene Rleg_6435 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_6435
Symbol
ID	8016934
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012854
Strand	+
Start bp	153174
End bp	154364
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	61%
IMG OID	644828230
Product	formaldehyde dehydrogenase, glutathione-independent
Protein accession	YP_002979430
Protein GI	241554217
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID	[TIGR02819] formaldehyde dehydrogenase, glutathione-independent

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.00150982
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGAGTAAAA ATAGAGGCGT CGTCTATCTC CGGCCGGGCA AGGTCGAAGT TCGCGACATC 
GACGACCCGA AGCTGGAAGC GCCTGACGGC CGCCGCATCG AACACGGCGT CATTCTGAAA 
GTGATTTCTA CCAATATCTG CGGCTCCGAT CAGCACATGG TCCGCGGCCG CACGACGGCG 
ATGCCGGGCC TGGTCCTTGG TCATGAAATC ACCGGCGAGA TCATCGAGAA AGGCATCGAT 
GTCGAGATGC TCGAAATCGG CGATATCGTC TCGGTGCCTT TCAATGTCGC CTGCGGCCGC 
TGCCGCTGCT GCAAGTCTCA GGATACCGGT GTCTGCCTGA CGGTAAACCC GGCCCGCGCC 
GGCGGTGCTT ATGGTTATGT CGACATGGGC GGCTGGATCG GCGGACAGGC ACGCTACGTC 
ACCATTCCCT ACGCAGATTT CAACCTGCTG AAAATCCCCG ATCGGGACAA GGCAATGGCG 
AAGATCCGGG ATCTCACCAT GCTCTCCGAC ATCCTGCCCA CCGGCTTCCA TGGCGCAGTG 
CGGGCAGGCG TTGGCGTCGG CTCGACCGTC TATGTCGCAG GCGCGGGCCC CGTCGGCCTT 
GCGGCTGCCG CTTCGGCTCG CATTCTCGGC GCCGCAGTCG TGATGATCGG TGACTTCAAC 
AAAGACCGTC TGGCGCATGC GGCGAAGGTC GGTTTCGAAC CGATCGACCT GTCGAAGAGC 
GACCGTCTTG GCGACATGAT CGCGCAGGTC GTCGGCACCA ACGAAGTGGA CAGCGCCATC 
GATGCTGTCG GCTTCGAGGC CCGCGGCCAC TCGGGCGGGG AACAGCCGGC GATCGTGCTC 
AATCAGATGA TGGAGATTAC CCGTGCCGCC GGTTCGATCG GCATTCCCGG CCTCTACGTT 
ACCGAGGATC CAGGTGCTGT CGACAATGCC GCCAAACACG GCAATTTGTC GCTTCGCTTC 
GGCCTCGGAT GGGCCAAGGC GCAGTCCTTC CACACCGGCC AGACTCCGGT GATCAAATAC 
AATCGTCAAC TCATGCAGGC GATCCTCCAC GACCGACTGC CAATTGCCGA TATCGTCAAC 
GCCAAGGTCA TCCCGCTCGA CGATGCCGCC AATGGATATG AGAGCTTCGA CCAGGGAGCG 
GCGACGAAAT ATGTCCTCGA TCCGCATGGC GAGGTGGCGA AAGCCGCATA G

Protein sequence

MSKNRGVVYL RPGKVEVRDI DDPKLEAPDG RRIEHGVILK VISTNICGSD QHMVRGRTTA 
MPGLVLGHEI TGEIIEKGID VEMLEIGDIV SVPFNVACGR CRCCKSQDTG VCLTVNPARA 
GGAYGYVDMG GWIGGQARYV TIPYADFNLL KIPDRDKAMA KIRDLTMLSD ILPTGFHGAV 
RAGVGVGSTV YVAGAGPVGL AAAASARILG AAVVMIGDFN KDRLAHAAKV GFEPIDLSKS 
DRLGDMIAQV VGTNEVDSAI DAVGFEARGH SGGEQPAIVL NQMMEITRAA GSIGIPGLYV 
TEDPGAVDNA AKHGNLSLRF GLGWAKAQSF HTGQTPVIKY NRQLMQAILH DRLPIADIVN 
AKVIPLDDAA NGYESFDQGA ATKYVLDPHG EVAKAA