Gene Rru_A0252 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rru_A0252
Symbol
ID	3833923
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodospirillum rubrum ATCC 11170
Kingdom	Bacteria
Replicon accession	NC_007643
Strand	-
Start bp	313535
End bp	314578
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	65%
IMG OID	637824331
Product	zinc-containing alcohol dehydrogenase superfamily protein
Protein accession	YP_425344
Protein GI	83591592
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID	[TIGR01202] 2-desacetyl-2-hydroxyethyl bacteriochlorophyllide A dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGTGA CGGGCGTTGT TCTCGAGCGT CAGGGTGCGC TCTCGCTTAG GGATATTGAT 
ATTCCCGGCA CATTGGCGCC CGGGGCCAAT GAGGTCCGCA TTGCCATCAA ATCCGTGGGG 
ATTTGCGGCA GCGATGTCCA CTATTTCAAG CATGGCCGCA TTGGCGACTT CATCGTCACC 
GAGCCGATGA TCCTGGGGCA TGAAGCCTCG GGCGTCGTAG AGGAAATCGG CTCGGCGGTG 
ACCCATCTGC GCGTTGGCGA CCGGGTGTGC ATGGAGCCGG GCGTTCCCGA CTTCTCGTCG 
ATCGAAACCC TGCGCGGCAT GTACAATCTT GATCCCTCGG TGCGCTTCTG GGCGACGCCG 
CCCTATCATG GCTGCTTGAC CGCCGAGGTC GTCCACCCCG CCTCGCTCAC CTATCGCCTG 
CCCGACTCCG TCAGCTTCGC CGAAGGCGCC ATGGTCGAAC CGCTGGCCAT CGGCGTCTAT 
GCCGCCGCCA AGGCGCAGAT CCGCCCGGGC GACATCGCCG TCGTCACCGG CGCGGGCACC 
ATCGGCATGA TGGTGGTCTT CGCCGCGCTG GCCGCCGGCT GCGCCGAGGT CATCGTCAGC 
GATGTGGCGG CCGAGAAGCT GGCCCTTTTG GCCAGCCATC CCGAGGTCAC CACCGTTGAC 
CTCACCCGCG AAAGCCTGGC CGACGCCGTG GCGGCGCGGA CCGATGGCCG TGGCGTCGAC 
GTGTTCTTCG AAGCCAGCGG CAGCACCCGC CCCTATGAGA CGATGATCGA TCTGATCGGC 
CGGGGCGGCC GCATCGTCCT CGTCGGCATG CCCCAGGAAA AGCCCCAGTT GGATGTAGTC 
GCCCTGCAGG TCAAGGAAAT CAGCCTGACG GGCACCTTCC GCTACGCCAA TGTCTGGGAC 
CGGACCTTGA AGCTGCTTGG CAGCGGCAAG ATCGACCTCA AACCGTTGAT TTCGGCCACC 
TTCCCCTTCA GTGACTCGGT CCGTGCCTTC GACCGCGCCG CCCAGCACCT GCCATCCGAC 
GTCAAGATCC AGATCTCCCT GTGA

Protein sequence

MKVTGVVLER QGALSLRDID IPGTLAPGAN EVRIAIKSVG ICGSDVHYFK HGRIGDFIVT 
EPMILGHEAS GVVEEIGSAV THLRVGDRVC MEPGVPDFSS IETLRGMYNL DPSVRFWATP 
PYHGCLTAEV VHPASLTYRL PDSVSFAEGA MVEPLAIGVY AAAKAQIRPG DIAVVTGAGT 
IGMMVVFAAL AAGCAEVIVS DVAAEKLALL ASHPEVTTVD LTRESLADAV AARTDGRGVD 
VFFEASGSTR PYETMIDLIG RGGRIVLVGM PQEKPQLDVV ALQVKEISLT GTFRYANVWD 
RTLKLLGSGK IDLKPLISAT FPFSDSVRAF DRAAQHLPSD VKIQISL