Gene RPB_1148 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_1148
Symbol
ID	3909236
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	1320460
End bp	1321479
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	68%
IMG OID	637883042
Product	alcohol dehydrogenase
Protein accession	YP_484769
Protein GI	86748273
COG category	[C] Energy production and conversion [R] General function prediction only
COG ID	[COG0604] NADPH:quinone reductase and related Zn-dependent oxidoreductases
TIGRFAM ID	[TIGR01202] 2-desacetyl-2-hydroxyethyl bacteriochlorophyllide A dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.712603
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGCGA TGGTCCTGCG GGAACACGGG GGGCTCGACA AGCTCACCTT CGATCCGAAT 
TTCCCCGATC CCGACATCGG ACCCGGCGAC GTGCTGTTGC GCGTGCGCGC GACCTCGCTG 
AACTATCACG ACATCTTCAC CCGTCGCGGC ATGCCGGGCA TCAAGATCCC GTTGCCGGTG 
ATCATGGGGC TCGATGTCGC AGGCGAGATC GTCGTGGTCG GCGACGGCGT CGAGGGCTGG 
AAGGCCGGCG ACCGCGTGCT GGTCGATCCG CTCAACCGCG TCGAAGGCGG GCTGATGGGC 
GAGACCATGA ATGGCGGCCT CGCCGAATTG TGCAAGGCGC GCGCGCATCA GCTCGTGCGT 
ATCCCCGATA ATGTGAGCTT CGAACAGGCC GCGGCGCTGC CGGTCGCCTA CGGCACCGCG 
CACCGCATGA TGACCACCAA CGGGCAGGTC AAGGCGGGCG AGAAGGTGCT GATCCTCGGC 
GCCTCCGGCG GCGTCGGCGT GTGCTGCGTG CAGCTCGCCA AGATCGCCGG CGCTTACGTG 
ATCGCCTGCG CCGGCTCCGC CGAGAAAGGC GAGCGCCTGA AGCAGCTCGG CGCCGACGAG 
GTCATCCTCT ACACGCAGGA AGACTTCATG CAGGTGGTGC GGCAACGCCA TGGCCGGCCG 
GCGCGGGTCG GCGGCACAGG CTCGGAGAAC GGCGGCGTCG ACGTCGTGGT GAATTTCACG 
GGCGGCGACA CCTGGGTGAA GTCGCTGCGC ACGCTCAAGC TCGGCGGTCG CATCCTGACC 
TGCGGCGCCA CCGCGGGCTA CGATCCGGCC GAGGATCTGC GCGTGATCTG GACGTTCGAG 
TTGCAGGTCC GCGGCTCCAA CGGCTGGGAG CGCGACGACA TCGAGAAGCT GTTCGGGCTG 
CTGTCGTCGG GACGGCTCAC CGCCAAGGTC GACAAGGCGT TTCCGCTGCA GCAGGCCGCG 
GATGCACTGG CGATGCTGGA AGACCGCACC GTGTTCGGAA AAGTCGTGGT GACGCCATGA

Protein sequence

MRAMVLREHG GLDKLTFDPN FPDPDIGPGD VLLRVRATSL NYHDIFTRRG MPGIKIPLPV 
IMGLDVAGEI VVVGDGVEGW KAGDRVLVDP LNRVEGGLMG ETMNGGLAEL CKARAHQLVR 
IPDNVSFEQA AALPVAYGTA HRMMTTNGQV KAGEKVLILG ASGGVGVCCV QLAKIAGAYV 
IACAGSAEKG ERLKQLGADE VILYTQEDFM QVVRQRHGRP ARVGGTGSEN GGVDVVVNFT 
GGDTWVKSLR TLKLGGRILT CGATAGYDPA EDLRVIWTFE LQVRGSNGWE RDDIEKLFGL 
LSSGRLTAKV DKAFPLQQAA DALAMLEDRT VFGKVVVTP