Gene Rsph17029_3621 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_3621
Symbol
ID	4898100
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009050
Strand	-
Start bp	713403
End bp	714446
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	74%
IMG OID	640114229
Product	alcohol dehydrogenase
Protein accession	YP_001045483
Protein GI	126464370
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGGCGC TCGTCCTCCA CGCCCCCCAC GACCTGCGGC TCGACGAGAT CGCCGCGGCG 
GCCGATCCCG GTCCCGGCGA GGTGCGCGTC GCGGTGAGCC ACGGCGGGAT CTGCGGCTCG 
GACCTGCATT ACTATCACCA CGGCGGCTTC GGCACCGTGC GGCTGCGCGA GCCGATGGCG 
CTCGGCCATG AGGTGTCCGG CATCGTGACG GCGCTCGGCG CCGGCGTGAC GGACCTCCGC 
GAGGGCGACC GCGTGGCGGT CAACCCCTCG CGGCCCTGCG GACGCTGCGA CTATTGCCGC 
CGCGGCCTCG CGCACCATTG TCTCGACATG CGCTTCAACG GCTCGGCCAT GCGCTTTCCG 
CACGAACAGG GCCTGTTCCG CGCGGCGGTG ACGCTGCCCG CCGCCCAGGC CGTGCGTCTG 
CCTGCGGAGA CCGACCTCGC GCTTGCCGCC ATGTCGGAGC CGCTGGCCGT CTGCCTTCAT 
GCCGTGGCGG GCGCGGGCAG CCTGATCGGC AAGCGGGTGC TCGTGTCGGG CTGCGGCCCG 
ATCGGCTGCC TGACGATCCT CGCCGCACGC GCGGCCGGGG CAGAAGAGAT CGTGGCCTCC 
GACATCGCGG CGCCCGCACT GGCAGCCGCC CGCGCGGTGG GCGCGGACAG GGTGCTCGAC 
CTTGCGGCCG AGTCCGAGGC GCTCGAGCCG TTCGCGGAAG GCAAGGGCCG GATCGACGTG 
GTGCTCGAAT GTTCGGGCGC CCCGCCCGCG CTTCTGGCGG CCCTCCGGGT GCTGCGTCCG 
CAGGGCCTTC TGGTCGCCGT GGGCCTCGGC CCCGAGGTCG CGCTGCCCGT GACCGCGCTC 
GTTGCCCGCG AGATCCGCCT GCAGGGCAGC TTCCGCTTCG ATGCGGAGTT CGCCACCGCC 
GCCCGGGCCA TCGCCTCGGG CCGCATCGAT GTGTCGCCGC TGCTCACCCG GGTGCTGCCC 
GTGACCGAAG CCGCGGACGC CTTCGCCCTC GCCTCGGACA AGAGCCGGGC GATGAAGGTG 
CAGATTGCCT TCCCGCCCCC GTGA

Protein sequence

MKALVLHAPH DLRLDEIAAA ADPGPGEVRV AVSHGGICGS DLHYYHHGGF GTVRLREPMA 
LGHEVSGIVT ALGAGVTDLR EGDRVAVNPS RPCGRCDYCR RGLAHHCLDM RFNGSAMRFP 
HEQGLFRAAV TLPAAQAVRL PAETDLALAA MSEPLAVCLH AVAGAGSLIG KRVLVSGCGP 
IGCLTILAAR AAGAEEIVAS DIAAPALAAA RAVGADRVLD LAAESEALEP FAEGKGRIDV 
VLECSGAPPA LLAALRVLRP QGLLVAVGLG PEVALPVTAL VAREIRLQGS FRFDAEFATA 
ARAIASGRID VSPLLTRVLP VTEAADAFAL ASDKSRAMKV QIAFPPP