Gene Rsph17029_1995 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_1995
Symbol
ID	4896113
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	+
Start bp	2114452
End bp	2115477
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	70%
IMG OID	640112589
Product	aldo/keto reductase
Protein accession	YP_001043871
Protein GI	126462757
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGATTGA CCATGCGTGA CTTCGACCGG ACGGGGCGCC CGCTACGCTT CACCGAGCTG 
GGCTTCGGCT CCTCGCCCCT GGGCAACCTC TACCGTGCCA TCTCGGACGA GGAGGCGCAG 
GCGCTGCTCG AACGCGCCTG GGCCGGCGGC ATCCGCTATT TCGACACGGC GCCCCTCTAT 
GGCTACGGGC TGGCCGAGGA ACGGCTGGGC CGCTTCCTGG CCGGGCACCC GCGGGCCGAT 
TATGTGCTCT CGACCAAGGT CGGGCGGCTC CTGCGGCCGG TCGAGCCGGG CGAGGCCCGC 
GACGGGTTGG GCAAGTTCTT CGAGGTGCCC GAGCGCAAGG AGCGGTTCGA CTACGGCTAC 
GACGGGGTGA TGCGCTCGCT CGAGGCTTCG CTCGACCGGC TCGGCCTCGA CCGGGTGGAT 
GTGCTCTATG CCCACGATCT CGACCTCTTC ACCCACGGCT CGCAGGAAGC GCTGGAGGCA 
CGGCTCGCGG AATTCATGGC CGGCGGCTAC CGGGCGCTGG TCGAGCTGCG CGATCAGGGC 
GTGATCTCGG CCTTCGGCGC GGGAGTGAAC GAGTGGCAGC CCTGCCAGTG GCTCGCCGAG 
CGGGGCGAGT TCGACCTCTT CCTCCTGGCC GGCCGCTACA CCCTTCTGGA GCAGGAGGCG 
CTCGAGAGCT TCCTGCCCCT GGCCGAAGAG CGCGGCATCG GCATCGTGAT CGGCGGCCCC 
TACAATTCCG GCGTTCTCGC CACGGGTCCG AAGCCCGGCT CCTTCTACGA TTACCGGCTG 
GCTCCGCAGG CCGTGCTCGA CCGGGTGGCC CAGATCCACA CGATCTGCGA GCGCTGGGGC 
GTGCGGATGT TCGAGGCGGC CTTCCAGTTC CCGCTGCGCC ACCCCGCCGT GCTCTCGGTG 
ATCCCCGGCC CGCAGTCGGT GGGCGAGGTG ATGGAGAACC GCATCGCGGC CGATGCCGAA 
CTGCCGCCGG GTCTGTGGGA GGATCTTAAG GTGGCGGGGC TCCTCCGCCC CGACGCGCCG 
GTCTGA

Protein sequence

MRLTMRDFDR TGRPLRFTEL GFGSSPLGNL YRAISDEEAQ ALLERAWAGG IRYFDTAPLY 
GYGLAEERLG RFLAGHPRAD YVLSTKVGRL LRPVEPGEAR DGLGKFFEVP ERKERFDYGY 
DGVMRSLEAS LDRLGLDRVD VLYAHDLDLF THGSQEALEA RLAEFMAGGY RALVELRDQG 
VISAFGAGVN EWQPCQWLAE RGEFDLFLLA GRYTLLEQEA LESFLPLAEE RGIGIVIGGP 
YNSGVLATGP KPGSFYDYRL APQAVLDRVA QIHTICERWG VRMFEAAFQF PLRHPAVLSV 
IPGPQSVGEV MENRIAADAE LPPGLWEDLK VAGLLRPDAP V