Gene RPB_4471 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_4471
Symbol
ID	3912287
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	5061218
End bp	5062258
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	65%
IMG OID	637886374
Product	fructose-bisphosphate aldolase
Protein accession	YP_488065
Protein GI	86751569
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3588] Fructose-1,6-bisphosphate aldolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATCTCG CCGACCTGAA CACGATCGCC CGCGCCATGG TCGCGCCCGG CAAGGGCATT 
CTCGCCGCCG ACGAATCCTC GGGAACCATC AAGAAGCGGT TCGACGTGAT CGGCGTCGAA 
TCGACCGAGA CCAGCCGCCG CGACTATCGC GAGATGATGT TCCGCTCCAA AGAGGCGATG 
AACGACTACA TCTCCGGCGT GATCCTGTAC GACGAGACGA TCTGGCAGAA CGCCGCCGAC 
GGTACGCCCT TGGTGAAGCT GATCGAGCAG GCCGGCAGCA TCCCCGGCAT CAAGGTCGAC 
GAAGGCACCC AGCCACTGCC GAACTGCCCG GGCGAAACCA TCACCGTCGG TCTCGACAAG 
CTCGCCGAGC GGCTGGCGAA ATATTACAAG CAGGGCGCGC GCTTCGCGAA ATGGCGCGCG 
GTGATCGATA TCGGCGCCGG CATTCCGAGC TACGCCGCGA TCCACACCAA CGCGCATGCG 
CTGGCGCGCT ATGCGGCGCT GTGCCAGCAG GCGCAGATCG TGCCGATCGT CGAGCCCGAG 
GTGCTGATGG ACGGCGACCA CGACATCGAC CGCTGCTACG AGGTCACCGA ATTCGTGCTC 
AAGGAGACCT TCCAGGAGCT GTACTACCAG AAGGTCGCGC TCGAAGGCAT GGTGCTGAAG 
CCGAACATGG CGGTCGCCGG CAAGAAGTCG GCCAAGTCGG CCGGCGTGCA GGAAGTCGCG 
GAGAAGACCG TGAAGCTGTT GAAGGCCTGC GTGCCGTCGG CGGTGCCGGG CATCGCGTTC 
CTGTCGGGCG GCCAGTCCGA CGAGGACGCC ACCGCGCATC TCGACGCCAT GAACAAAATC 
GGCGGCCTGA CTTCGGGCCT TCCTTGGGGC CTCACCTTCT CCTACGGCCG TGCCCTGCAG 
GCCGCGCCGC AGAAGGCGTG GTCCGGCAAG GCCGACAACG TCGCGGCCGG CCAGGCCGCA 
TTCACCCACC GGGCGAAAAT GAACTCGCTC GCCAGCAAGG GCGAGTGGTC ATCCGACCTC 
GAAAGCAAGA AGGCCGCATA A

Protein sequence

MNLADLNTIA RAMVAPGKGI LAADESSGTI KKRFDVIGVE STETSRRDYR EMMFRSKEAM 
NDYISGVILY DETIWQNAAD GTPLVKLIEQ AGSIPGIKVD EGTQPLPNCP GETITVGLDK 
LAERLAKYYK QGARFAKWRA VIDIGAGIPS YAAIHTNAHA LARYAALCQQ AQIVPIVEPE 
VLMDGDHDID RCYEVTEFVL KETFQELYYQ KVALEGMVLK PNMAVAGKKS AKSAGVQEVA 
EKTVKLLKAC VPSAVPGIAF LSGGQSDEDA TAHLDAMNKI GGLTSGLPWG LTFSYGRALQ 
AAPQKAWSGK ADNVAAGQAA FTHRAKMNSL ASKGEWSSDL ESKKAA