Gene RPB_3567 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_3567
Symbol
ID	3911369
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	4088395
End bp	4089675
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	72%
IMG OID	637885469
Product	hydroxypyruvate reductase
Protein accession	YP_487173
Protein GI	86750677
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2379] Putative glycerate kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.187616
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.669404
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGACC AACGTCCCCT GCTCCGCGCG CTGTTCGACG CCGCCGTCGC GGCCGCGCAT 
CCGGACAGCA TTCTCGCCGC GCATCTGCCG CCGCTGCCGC GCGGCCGGAT CATCTGCCTC 
GCCGCCGGCA AGGGTGCCGC CGCGATGGCC GCCGCCGCGG AGCGGCATTA TCTCGACACG 
CTCGGGCTCG CGCCCTCACG TCTGATCGGC ATCGCCACCA CCCGCCACGG CCATCGCGTG 
GCGACCCGCG CCATCGACGT GATCGAGGCC GGGCACCCGA TGCCCGACGC CGAAGGGCTG 
CGCGGTGCCG AAGCGAGCCT GAAGCTCGCC GCCACCGCGA CCGCCGACGA TCTGCTGCTG 
GTGCTGCTGT CGGGCGGCGG CTCGGCGAAC TGGATCCTGC CGGCCGACGG CATCACGCTC 
GCGCAAAAGC AGGCCACCAC GCGCGCGCTG CTGCGCTCCG GCGCGCCGAT CGGCGAGGTC 
AACACCGTCC GCAAGCATCT GTCGCGGATC AAGGGCGGCC GCCTCGCTTG CGCCGGCAGC 
AGCGCCGCCG AAATCGTGAC GCTGGCGATT TCCGACGTGC CGCGCGACGA GGCATCGGCG 
ATAGCGTCCG GGCCGACCGT GCCCGATCCG ACGACGCTGG ACGACGCCCG CGCACTGGTG 
GCGCGCTACA AGCTCGACAT CGACGACGCA GTCCATGCCG CGCTGAATGA TCCACGCAAC 
GAAAGCTGCA AGCCGGGCGA CGCCGCTTTC GCCCGCGCCC GCTTCGCCAT CATCGCGCGG 
CCGCGGCAAT CGCTGGACGC CGCGATCAAG CTGGCGCGCG ATTCCGGCTA TGCGATCGCC 
GATCTCGGCG CCGATCTCGA AGGCGAAGCC CGCGACGTGG CTGCCGCCCA CGCCCGGCTC 
GCGCGCGAGG CCCGTGCGGC CGGCAGGCGG CTCGCGATCA TCTCCGGCGG CGAACTCACC 
GTCACCGTGC GCGGCAACGG CCGCGGCGGC CCCAACCAGG AATATGCGCT GGCGCTGGCG 
CAGCACCTGC GCGACCTGCC GGACATCGCA GCCCTCGCCG CCGACACCGA CGGCGCCGAC 
GGCGGCGCCG GCCACGCCAC CGACCCCGCC GGCGCGCTGA TCGACGCCCG CACCTTCGCG 
AAGATCGACG AGCGCGATCT CGACCCTACC GCCTATCTGG CGAACAACGA CGCTACCGGC 
TTCTTCGACC AGACCGGCGA CCTGCTCGTC ACCGGCCCGA CGCTGACCAA CGTCAACGAT 
ATCCGGGTGA TCCTGGTGTA G

Protein sequence

MTDQRPLLRA LFDAAVAAAH PDSILAAHLP PLPRGRIICL AAGKGAAAMA AAAERHYLDT 
LGLAPSRLIG IATTRHGHRV ATRAIDVIEA GHPMPDAEGL RGAEASLKLA ATATADDLLL 
VLLSGGGSAN WILPADGITL AQKQATTRAL LRSGAPIGEV NTVRKHLSRI KGGRLACAGS 
SAAEIVTLAI SDVPRDEASA IASGPTVPDP TTLDDARALV ARYKLDIDDA VHAALNDPRN 
ESCKPGDAAF ARARFAIIAR PRQSLDAAIK LARDSGYAIA DLGADLEGEA RDVAAAHARL 
AREARAAGRR LAIISGGELT VTVRGNGRGG PNQEYALALA QHLRDLPDIA ALAADTDGAD 
GGAGHATDPA GALIDARTFA KIDERDLDPT AYLANNDATG FFDQTGDLLV TGPTLTNVND 
IRVILV