Gene Rsph17029_3940 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_3940
Symbol
ID	4898327
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009050
Strand	-
Start bp	1073702
End bp	1074721
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	70%
IMG OID	640114543
Product	aldo/keto reductase
Protein accession	YP_001045790
Protein GI	126464677
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.336434
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTTACC GTCGTCTCGG CCCGAGCGGC CTTTTTGTCT CCGAGCTCTG CCTCGGCACC 
ATGACCTTCG GCGGCTCGGA CGGCATCTGG GGCCAGATCG GTCAGCTCGG ACAGGACGAG 
GCGGATGCGC TGGTGCGCAC CGCGCTCGAT GCGGGCATCA ATTTCATCGA CACGGCCAAT 
GTCTATGCGG GCGGCGAGAG CGAGCGCATC CTCGGCCGGT CGCTGCGCAA CCTCGGGGTG 
CGGCGCGAGG ATGTGGTGAT CGCGACCAAG GTGCTCGGGC CGATGGGCGC GGGCGTCAAT 
GCGCGCGGGG CCTCGCGCGT CCATATCCTC GATCAGTGCA AGGCCAGCCT CGAGCGGCTG 
CAGCTCGACC ATATCGACCT CTATCAGATC CACGGGTTCG ACGCCGAGAC CCCCATCGTC 
GAGACGCTGG AGGCGCTCGA CACGCTCGTG CGCCACGGCC ATGTCCGCTA CATCGGCCTG 
TCGAACTGGG CGGCCTGGCA GGTGATGAAG GCGGTGGGGA TCGCCGAGGC GCGCCGGCTG 
GCGCCGATCC TGTCGCTTCA GGCCTATTAC ACCCTGGCCG GCCGGGATCT CGAGCGCGAG 
GTGGTGCCGA TGCTGAAGGA CACGGGCATG GGCCTCATGG TCTGGAGCCC GCTGGCGGGC 
GGCTTCCTGT CGGGGAAATA CGACCGCGAG GGCAAGGCCG CCGACGGGCG CCGCGCGGCC 
TTCGACTTCC CGCCGGTCGA CAAGGATCGC GGCTGGACCG TGATCGAGGC GATGCGCCCC 
ATCGCGGAGG CCAAGGGCTC GTCTGTCGCG CAGGTGGCGC TGGCCTGGCT CCTGCATCAG 
GAGGCGGTCA CGAGCGTGAT CGTGGGGGCC AAGCGCGTGG ACCAGCTGGC CGACAACATC 
GCCGCGACCG AGGTGCGCCT CGAGGCCGAG GATCTGGCGG CGCTCGACCG GGCGAGCGCG 
CTGGCGCCGG AATATCCGGG CTGGATGCTC GAGCGGCAGC GGAGCTACCG CGCCCGGTAG

Protein sequence

MRYRRLGPSG LFVSELCLGT MTFGGSDGIW GQIGQLGQDE ADALVRTALD AGINFIDTAN 
VYAGGESERI LGRSLRNLGV RREDVVIATK VLGPMGAGVN ARGASRVHIL DQCKASLERL 
QLDHIDLYQI HGFDAETPIV ETLEALDTLV RHGHVRYIGL SNWAAWQVMK AVGIAEARRL 
APILSLQAYY TLAGRDLERE VVPMLKDTGM GLMVWSPLAG GFLSGKYDRE GKAADGRRAA 
FDFPPVDKDR GWTVIEAMRP IAEAKGSSVA QVALAWLLHQ EAVTSVIVGA KRVDQLADNI 
AATEVRLEAE DLAALDRASA LAPEYPGWML ERQRSYRAR