Gene Rleg_1899 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_1899
Symbol
ID	8012948
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	+
Start bp	1884182
End bp	1885162
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	60%
IMG OID	644824488
Product	Alcohol dehydrogenase zinc-binding domain protein
Protein accession	YP_002975720
Protein GI	241204624
COG category	[C] Energy production and conversion [R] General function prediction only
COG ID	[COG0604] NADPH:quinone reductase and related Zn-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.317199
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.179225
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAAAA CGCAGGCTGT TTCATTTTCG AGAACGGGTG GGCCGGAGGT TTTCGACTAT 
GTCGAGATCG ATCTTCCCTC ACCCTCGACG GGCGAAGTGC AGATCAGGCA GGCGGCGGTT 
GGGCTTAATT TCATCGACGT CTATTTCCGC AACGGCACCT ACAAGGCGCC GCATCTGCCC 
TTCGTCACCG GCAAGGAGGG CGCCGGCACC GTGACATCGG TCGGTCCCGG CGTCGAGGAT 
TTCAAGGTCG GCGACCGTGT CGCCTATGCC AGTGCCGATG GTGCCTATAG CGCCGAGCGC 
AATGTCGAGA CGCGCCATCT GGTGCATGTT CCCGAGGGAA TCGAGCTCGA AACCGCAGCG 
GCGATGATGC TGAAGGGCAT GACCGCCGAA TATCTCTTGA ACCGCACCTT CAAGGTCGGC 
CCGCAGACCG TCCTGCTGTT CCACGCCGCT GCCGGCGGCG TCGGCCTGAT CGCCGGCCAA 
TGGGCTAAGG CGCTGGGCGC CACCGTCATC GGCACGGCGG GCTCTGAAGA CAAGATCGAG 
CTGGCGCTCG CCCATGGCTA CGATCATGTG ATCAACTACA AGAGCGACAG CTTCGTCGAC 
CGTGTCCGCG ACATCACCGG CGGCAAGGGC GTGGATGTCG TCTACGATTC GATCGGCCGC 
GATACTTTTC CACAGTCGCT TGACTGCCTG AAGCCGCGGG GCCTTTTTGC CTCCTTCGGC 
CAATCCTCCG GACCGATCGA GAATTTCACC CTTGCGGCTC TGGCGCAAAG GGGCTCGCTC 
TTTGCGACGC GGCCGACGCT CTTCACCTAT ATCGCCACGC GTCAGGAACT GATCGACAGT 
GCGAAAGCGC TATTTGATAT TGTGCAAAGC AACAAAGTGC GTATCAATAT CAATCAAACC 
TATCCGCTGC GTGAGGTTGG GCGGGCTCAT GCGGATCTGG AGACAAGAAA AACAACAGGA 
ACGACGCTGC TGATTCCATG A

Protein sequence

MTKTQAVSFS RTGGPEVFDY VEIDLPSPST GEVQIRQAAV GLNFIDVYFR NGTYKAPHLP 
FVTGKEGAGT VTSVGPGVED FKVGDRVAYA SADGAYSAER NVETRHLVHV PEGIELETAA 
AMMLKGMTAE YLLNRTFKVG PQTVLLFHAA AGGVGLIAGQ WAKALGATVI GTAGSEDKIE 
LALAHGYDHV INYKSDSFVD RVRDITGGKG VDVVYDSIGR DTFPQSLDCL KPRGLFASFG 
QSSGPIENFT LAALAQRGSL FATRPTLFTY IATRQELIDS AKALFDIVQS NKVRININQT 
YPLREVGRAH ADLETRKTTG TTLLIP