Gene RPC_4893 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_4893
Symbol
ID	3973715
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	-
Start bp	5462941
End bp	5463996
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	65%
IMG OID	637928005
Product	alcohol dehydrogenase GroES-like protein
Protein accession	YP_534734
Protein GI	90426364
COG category	[R] General function prediction only
COG ID	[COG1064] Zn-dependent alcohol dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTCATG TCAAAGCCTA TGCCGCGCAG TCCGCGGCTT CGCCGATCGC GCCGTTCAGC 
CTGGAGCGGC GCGAACCCGG TCCGCACGAC GTGCAGATCG ATATTCTGTA TTGCGGCGTC 
TGCCATTCCG ATCTGCACCA GGCCCGCAAC GATTGGAGCA ACTCGCTGTA TCCGATGGTG 
CCCGGCCACG AAATCGTCGG CCGCGTGGTC GCCACCGGCG CTCATGTGAA GAACCTCAAG 
GTCGGCGATT TCGCCGGCGT CGGCTGCATG GTGGATTCCT GCCGGCATTG CGCGCCGTGC 
GAGGCCGGGC TCGAGCAATA TTGCATCGAG GGCGCGACCT GGACCTACAA CGCGCACGAA 
CGCGGCTCGC AGCAGCTGAC CTTCGGCGGC TATTCCGAAG CGATCGTCGC CGACGAACGC 
TTCGTGGTGA AGATCCCCGC CCACATGGAT CTGAAGGCGG TGGCGCCGCT GCTCTGCGCC 
GGCATCACCA CCTGGTCGCC GCTGCGGCAC TGGAAGGTCG GCAAAGGCCA GAAGGTCGGC 
GTCGTTGGGC TCGGCGGCCT CGGCCATATG GGCGTGAAGT TCGCCAAGGC GCTCGGCGCC 
CATGTGGTGA TGGTCACCAC CTCGCCGGAG AAGGGCAAGG ACGCGATCCG GCTCGGCGCC 
GACGAGGTGC TGGTGTCGAA GGACGCGAAC GCTATGGCCA AGGCCAAGGG CTCGTTCGAC 
TTCCTGCTCA ACACCATCCC GGTCGGCCAC GACGCCAACC CGTATTTGCA GTTGCTCAAG 
CTCGACGGCG CGATGGTGAT GGTCGGCGCG CTGACGCCGC TGGATCCGAT CGTCGGCGGC 
AATCTGATCC ACGGCCGCCG CAGCATCGCC GGCTCGGGGA TCGGCGGCAT GCCGGAGACC 
CAGGAGATGA TCGATTTCTG CGCCGAACAC GGCATCGTCT CCGACGTCGA AATGATCCGC 
ATCCAGGACA TCAACAAAGC CTATGAGCGG CTGTTGAAGA ACGACGTGCG CTATCGCTTC 
GTCATCGACA TGGCGTCGCT GAAGAACGCG GGTTGA

Protein sequence

MIHVKAYAAQ SAASPIAPFS LERREPGPHD VQIDILYCGV CHSDLHQARN DWSNSLYPMV 
PGHEIVGRVV ATGAHVKNLK VGDFAGVGCM VDSCRHCAPC EAGLEQYCIE GATWTYNAHE 
RGSQQLTFGG YSEAIVADER FVVKIPAHMD LKAVAPLLCA GITTWSPLRH WKVGKGQKVG 
VVGLGGLGHM GVKFAKALGA HVVMVTTSPE KGKDAIRLGA DEVLVSKDAN AMAKAKGSFD 
FLLNTIPVGH DANPYLQLLK LDGAMVMVGA LTPLDPIVGG NLIHGRRSIA GSGIGGMPET 
QEMIDFCAEH GIVSDVEMIR IQDINKAYER LLKNDVRYRF VIDMASLKNA G