Gene Rsph17029_3051 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_3051
Symbol
ID	4898457
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009050
Strand	-
Start bp	62137
End bp	63123
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	70%
IMG OID	640113653
Product	4-hydroxythreonine-4-phosphate dehydrogenase
Protein accession	YP_001044923
Protein GI	126463810
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1995] Pyridoxal phosphate biosynthesis protein
TIGRFAM ID	[TIGR00557] 4-hydroxythreonine-4-phosphate dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.848678
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0620794
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCAGTT CCCCCCAACC CATCGTCATC ACGATGGGCG ATCCGTCCGG GGTCGGCGCC 
GAAGTGACGG TGAAGGCGCT CGCCGACCTC GCCCCCGCAA GGCGCCGGGC CTATGCGGTG 
ATCGGCGACC GTGAGACGCT TCTGCGCGCG CGCGCCGCCT GTGGCCTCGA TCTGGCGCTG 
CACGAGTTCG GCGACGAGGC CCCCGAGGGC TCGGTCGCCG TGATCCACGA GGAGGTGGCC 
GGCCTGCCGG GCCGCTTCGG GGTGCTCTCG CCCGCCTGCG GCGAGGCCTC GTTCCGCTAC 
ATCGACCGGG CCGTCACCAT GACGCGCGGC GGCGAGGCCG CCTGCATCGT CACGGCGCCG 
ATCAACAAGG AGGCGCTGAA CGCGGCCGGC CATCATTACG ACGGCCACAC GGGGATGCTC 
GCCCATCTGA CTGGCTGCGC CGCCTCGTGG ATGCTGCTCG CCTCGCCCAC GCTGAACGTG 
ATCCATGTCT CGACCCACAT CTCGCTGAAG GAGGCCATCG GCCGGGCCAC GCCCGAGCGG 
GTGCTCGAAA CCATCCGCAC CGGGCACCGG CACCTGCAGC GCATGGGGAT CGCGCAGCCG 
CGGATCGCGG TGGCGGGGAT CAATCCACAT TGCGGCGAGA ACGGGCTCTT CGGGCGCGAG 
GACGATCTGC AGGTGCAGCC GGCGGTCGAG GCCGCGCGGG CCGAGGGCAT CGACGTGGTG 
GGTCCGATCC CGGCCGATAC GGTCTATTAC CGCGCCCATT CCGGTGCCTT CGACCTTGTG 
GTGGCGCAGT ATCACGATCA AGGCCACATC CCGATCAAGC TCATCGCCTT CGACACGGCG 
GTCAACTGCT CGCTGGGGTT GCCCATCGAC CGCTGCTCGG TCGATCACGG CACCGCCTTC 
GACATCGCAG GCACCGGGCG GGCCAATCAC GTCAACATGC TGGCGGCGCT GGCCTACGCG 
GACAAGCTGG TCGCGGGCCG CGGCTGA

Protein sequence

MSSSPQPIVI TMGDPSGVGA EVTVKALADL APARRRAYAV IGDRETLLRA RAACGLDLAL 
HEFGDEAPEG SVAVIHEEVA GLPGRFGVLS PACGEASFRY IDRAVTMTRG GEAACIVTAP 
INKEALNAAG HHYDGHTGML AHLTGCAASW MLLASPTLNV IHVSTHISLK EAIGRATPER 
VLETIRTGHR HLQRMGIAQP RIAVAGINPH CGENGLFGRE DDLQVQPAVE AARAEGIDVV 
GPIPADTVYY RAHSGAFDLV VAQYHDQGHI PIKLIAFDTA VNCSLGLPID RCSVDHGTAF 
DIAGTGRANH VNMLAALAYA DKLVAGRG