Gene RPD_1049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1049
Symbol
ID	4021525
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	1201968
End bp	1203212
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	70%
IMG OID	637961241
Product	iron-containing alcohol dehydrogenase
Protein accession	YP_568188
Protein GI	91975529
COG category	[C] Energy production and conversion
COG ID	[COG1454] Alcohol dehydrogenase, class IV
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGTCCC GACCGCGCAA GGCAATCGTC GGCGCGTGGC CTGTTGTCGA GCGCCTGATG 
ATCCCCGCTT TTTCAATCGC CCGTCTGCCC CGCATTGAAT TCGGCGCGGG CGCCGTGGCC 
CGGCTGCCGC AACTCGCCGC GCGCTACGGC CGCCGCGTGC TGCTGGTCAC CGGCGCGCAT 
TCATTCGACC GCGCTCCCTA TGCCGCAGCG CTGCTCGCGG GTCTTCGCGA CCATGGCCTC 
AACTGGGACA GGGTGACGAT CGGCGGCGAA CCATCGCCGG AGGCGGTCGA CGCCGCCGTG 
CACGACTGGC ATAGCTGCGA CATCGACGCC GTGATCGGGA TCGGCGGCGG CAGCGCGCTC 
GATGCCGCCA AGGCGATCGC CGGCCTGCTG CGGCCCGGTA ATTCGGTGAT GGATCATCTC 
GAAGGCGTCG GGCCGGAATT GCCGTATCGC GGCCCGGCGA CGCCGTTCAT CGCGGTGCCG 
ACCACCGCCG GCACCGGCTC CGAGGCGACA AAGAACGCGG TGTTGTCGCG GCATGGCGCC 
CATGGCTTCA AGAAGTCATT CCGCGACGAG GCGCTGGTGG CCGAGATCGC GCTGGTCGAT 
CCCGATCTGC TGGCCGGGTG CCCGCCGGAG CTGATCGCGG CCAACGGCAT GGACGCACTG 
ACCCAGCTGC TCGAATCCTA CGTCTCGACC CGCGCCAATC CGTTCACCGA CGCATTGGCG 
CTGTCCGGCC TGCGCGCCGT CCGCGACGGC CTGCTCGCCT GGTATGAAGG CGGCGACGCG 
GCGCGGGCCG CCCAGGCGCA GATGGCCTAT GCGTCGCTGC AGTCCGGCAT TTGTCTCGCG 
CAGACCGGGC TCGGCTCGGT CCACGGGCTG GCGTCGCCGC TCGGCGCGTT CTTTCCGATC 
GGCCACGGCG TCGTCTGCGG CACGCTGGTG GCGGCCGCGA CGCGCGTCAA CATCGACGCG 
ATGGATGCGC GTGCGCCGCA CCATCCTGCG CTGGAGAAAT ACGCCGAGAT CGGCCGTCTG 
CTGTCCGGGC GTAGCGGCGC CGGCGTCGCG GAGGATCGCG ACAATCTCGT GCGCACGCTG 
GACGACTGGA CGCGGCGGCT GTCGCTGCCG AAGCTATCCG CGCTCGGCGT CGCCACTGGC 
GATTTCGACC GGATCGTCGC GGCCAGCCGT GGCTCCAGTA TGAAGACCAA TCCGGTGGTG 
CTGACCGATG ATGAGATCAG GCGCGTGTTG AGCTCCCGCT TCTGA

Protein sequence

MLSRPRKAIV GAWPVVERLM IPAFSIARLP RIEFGAGAVA RLPQLAARYG RRVLLVTGAH 
SFDRAPYAAA LLAGLRDHGL NWDRVTIGGE PSPEAVDAAV HDWHSCDIDA VIGIGGGSAL 
DAAKAIAGLL RPGNSVMDHL EGVGPELPYR GPATPFIAVP TTAGTGSEAT KNAVLSRHGA 
HGFKKSFRDE ALVAEIALVD PDLLAGCPPE LIAANGMDAL TQLLESYVST RANPFTDALA 
LSGLRAVRDG LLAWYEGGDA ARAAQAQMAY ASLQSGICLA QTGLGSVHGL ASPLGAFFPI 
GHGVVCGTLV AAATRVNIDA MDARAPHHPA LEKYAEIGRL LSGRSGAGVA EDRDNLVRTL 
DDWTRRLSLP KLSALGVATG DFDRIVAASR GSSMKTNPVV LTDDEIRRVL SSRF