Gene Rsph17029_4002 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_4002
Symbol
ID	4899141
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009050
Strand	+
Start bp	1145891
End bp	1146892
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	67%
IMG OID	640114605
Product	glyceraldehyde-3-phosphate dehydrogenase, type I
Protein accession	YP_001045852
Protein GI	126464739
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0057] Glyceraldehyde-3-phosphate dehydrogenase/erythrose-4-phosphate dehydrogenase
TIGRFAM ID	[TIGR01534] glyceraldehyde-3-phosphate dehydrogenase, type I

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAATCA GGGTTGCCAT CAACGGCTTC GGCCGTATCG GCCGCAACGT GCTGCGGGCC 
ATCGTGGAGT CGGGGCGCAC CGATATCGAG GTGGTCGCGA TCAACGATCT GGGTCCGGTC 
GAGACCAACG CGCATCTTCT GCGCTTCGAC AGCGTGCACG GCCGCTTCCC GGCCAAGGTC 
ACCAGCGGAG ACGACTGGAT CGATGTGGGC CGCGGCCCGA TCAAGGTGAC GGCGATCCGC 
AATCCGGCGG AGCTGCCCTG GGCGGGTGTC GACGTGGCGA TGGAATGCAC GGGCATCTTC 
ACCTCGAAGG AGAAGGCCGC GGCCCATCTG CAGAACGGGG CGAAGCGGGT GCTCGTCTCG 
GCGCCCTGCG ACGGGGCCGA CCGGACCATC GTCTATGGGG TGAACCATGC GACGCTCACC 
GCGGACGACC TCGTGGTCTC GAATGCCTCC TGCACCACCA ACTGCCTCTC GCCGGTGGCC 
AAGGTGCTTC ACGATGCGAT CGGCATCGCC AAGGGCTTCA TGACCACGAT CCACAGCTAC 
ACGGGCGACC AGCCCACCCT CGACACGATG CACAAGGATC TCTACCGCGC GCGGGCCGCG 
GCGCTGAGCA TGATCCCGAC CTCGACCGGC GCCGCGAAGG CCGTGGGCCT CGTGCTGCCC 
GAGCTCAAGG GCCGGCTCGA CGGCGTGTCG ATCCGGGTGC CCACGCCCAA TGTCTCGGTG 
GTGGATCTGG TGTTCGAGGC CGCCCGCGAC ACGACGGTGG AGGAGGTGAA TGCGGCCATC 
GAGGCCGCCG CCCGCGGACC GTTGAAGGGC GTGCTGGGCT TCACGACCGA GCCCAACGTC 
TCGTCCGACT TCAACCACGA CCCGCATTCG TCGGTGTTCC ACATGGACCA GACCAAGGTG 
ATGGAGGGCC GCATGGTCCG CATCCTCAGC TGGTACGACA ACGAATGGGG CTTCTCGAAC 
CGGATGGCCG ACACCGCCGT GGCGATGGGC CGGCTTCTCT GA

Protein sequence

MTIRVAINGF GRIGRNVLRA IVESGRTDIE VVAINDLGPV ETNAHLLRFD SVHGRFPAKV 
TSGDDWIDVG RGPIKVTAIR NPAELPWAGV DVAMECTGIF TSKEKAAAHL QNGAKRVLVS 
APCDGADRTI VYGVNHATLT ADDLVVSNAS CTTNCLSPVA KVLHDAIGIA KGFMTTIHSY 
TGDQPTLDTM HKDLYRARAA ALSMIPTSTG AAKAVGLVLP ELKGRLDGVS IRVPTPNVSV 
VDLVFEAARD TTVEEVNAAI EAAARGPLKG VLGFTTEPNV SSDFNHDPHS SVFHMDQTKV 
MEGRMVRILS WYDNEWGFSN RMADTAVAMG RLL