Gene Rsph17029_1604 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_1604
Symbol
ID	4895080
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	+
Start bp	1687991
End bp	1688992
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	65%
IMG OID	640112195
Product	glyceraldehyde-3-phosphate dehydrogenase, type I
Protein accession	YP_001043486
Protein GI	126462372
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0057] Glyceraldehyde-3-phosphate dehydrogenase/erythrose-4-phosphate dehydrogenase
TIGRFAM ID	[TIGR01534] glyceraldehyde-3-phosphate dehydrogenase, type I

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.531435
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0505585
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGTGA AAGTGGCAAT CAACGGCTTC GGCCGCATCG GGCGGAACGT GCTCCGCGCC 
ATCATCGAAT CGGGCCGGAC CGATATCGAG GTGGTGGCGA TCAACGATCT CGGCCCGGTC 
GAGACCAACG CGCACCTGCT GCGCTTCGAC TCGGTCCACG GCCGCTTCCC CGCCACCGTC 
ACCACCACCG AGAAGACCAT CGACGTGGGC CGCGGCCCGA TGGATGTGAC CGCGATCCGC 
AACCCGGCCG AACTGCCCTG GGGCCATGTC GACATCGTGC TCGAATGCAC CGGCATCTTC 
ACCGACAAGG AGAAGGCGAA GGTCCACCTC GAGAGCGGCG CCAAGCGCGT GCTGGTCTCG 
GCCCCCTCGA CCGGCGCCGA CAAGACCATC GTCTATGGCG TGAACCACGA GACCCTGACC 
AAGGACGACC TCATCGTCTC GAACGCCTCC TGCACGACGA ACTGCCTCTC GCCGGTCGCC 
AAGGTGCTGA ACGACACGAT CGGCATCACC AAGGGCTTCA TGACGACGAT CCACAGCTAT 
ACGGGCGACC AGCCGACGCT CGACACGATG CACAAGGATC TCTACCGCGC CCGCGCCGCG 
GCGCTGAGCA TGATCCCGAC CTCGACCGGC GCCGCCAAGG CCGTGGGCCT CGTGCTGCCG 
GAACTGAAGG GCAAGCTCGA CGGCGTGGCG ATCCGGGTGC CGACGCCGAA CGTCTCGGTG 
GTGGACCTCG TGTTCGAAGC CTCGCGCGCG ACCAGCGTCG AGGAAGTGAA CGCCGCCATC 
CGCGAGGCTG CCGACGGCAA GCTGAAGGGC ATCCTCGGCT ATACCGACCA GCCCAACGTC 
TCGATGGACT TCAACCACGA TCCGCACAGC TCGATCTTCC ACCTCGACCA GACCAAGGTC 
ATGGAAGGCA ACATGGTGCG GATCCTCACC TGGTACGACA ACGAATGGGG CTTCTCGAAC 
CGCATGGCCG ATACGGCCGT GGCCATGGGC AAGCTCATCT GA

Protein sequence

MTVKVAINGF GRIGRNVLRA IIESGRTDIE VVAINDLGPV ETNAHLLRFD SVHGRFPATV 
TTTEKTIDVG RGPMDVTAIR NPAELPWGHV DIVLECTGIF TDKEKAKVHL ESGAKRVLVS 
APSTGADKTI VYGVNHETLT KDDLIVSNAS CTTNCLSPVA KVLNDTIGIT KGFMTTIHSY 
TGDQPTLDTM HKDLYRARAA ALSMIPTSTG AAKAVGLVLP ELKGKLDGVA IRVPTPNVSV 
VDLVFEASRA TSVEEVNAAI REAADGKLKG ILGYTDQPNV SMDFNHDPHS SIFHLDQTKV 
MEGNMVRILT WYDNEWGFSN RMADTAVAMG KLI