Gene RPD_0720 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_0720
Symbol
ID	4021193
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	810141
End bp	811235
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	68%
IMG OID	637960909
Product	phospho-2-dehydro-3-deoxyheptonate aldolase
Protein accession	YP_567859
Protein GI	91975200
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0722] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR00034] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTTGACCA CCACCGACGA CCTTCGCCTC AAGCAACTCA CCGAACTCAG TACGCCCGAC 
GAGGTGATAC GCGAGATCCC GCGCACGCTT GCCGCGACGC GCACCGTTGC TGCGGCGCGC 
AGCGCCATTC ACGACATCCT CACCGGCGCC GACGACCGGC TGCTCGTGGT GGTCGGCCCC 
TGTTCGATTC ACGATCCGGC CGCGGCCATG GACTATGCCA GCCGTCTGGC GGCGCTGCGC 
GAAACCCTCG CCGACCGGCT CGTGATCGTG ATGCGGGTGT ATTTCGAGAA GCCGCGCACC 
ACCGTGGGCT GGAAAGGGCT GATCAACGAC CCCGACCTCG ACGGCAGCTT CCGGATCGAC 
AAGGGGCTGC GGCTGGCGCG GCAGGTGCTT GCGGCCGTGA ACAATCTCGG CCTGCCCGCC 
GCGACCGAAT TCCTCGACCT GATCACGCCG CAATACATTG CGGATCTCGT CGCCTGGGGC 
GCGATCGGCG CCCGCACCAC CGAGAGCCAG ATTCACCGCG AACTGGCGTC GGGCCTGTCG 
TGCCCGATCG GCTTCAAGAA CGGCACCGAC GGCAATGTCC GGATCGCGGC GGAGGCCGTG 
AAGTCGGCTA CGCAGCCGCA TCATTTCATG GCGGTGACCA AGGGCGGCCG CAACGCCATC 
GCGGCCACCA CCGGTAACAA CGACTGCCAC GTCATCCTGC GCGGCGGCGT CGCGCCGAAC 
TTTGACGCCG CAAGCGTCGA AGCCGCCGCC GCGGTGCTCG GCAAGGTCGG CATCGCTCCG 
CGTTTGATGA TCGATGCCAG CCACGCCAAC AGCAGCAAGC AGCCGGAGAA CCAGCCCAAA 
GTCGCGGCCG ATGTCGCGCG TCAGGTGGCG GCGGGCGATG CCCGCATCAT CGGCATGATG 
ATCGAGAGCA ACCTCGTTGC CGGCCGGCAG GAGGTGGTGC CGGGCAAGCC GCTGACTTAC 
GGCCAGAGCA TCACCGACGG CTGCATCGAC TGGGCGACGA CCGAAAGCGT GCTGCATGAT 
CTCGCCACCG CCGTGGAAGG CCGGCGCGCC GCCAGGCAGC CGGCGCGGCT GCAGCACAAG 
GGTGCCGCGG CCTGA

Protein sequence

MLTTTDDLRL KQLTELSTPD EVIREIPRTL AATRTVAAAR SAIHDILTGA DDRLLVVVGP 
CSIHDPAAAM DYASRLAALR ETLADRLVIV MRVYFEKPRT TVGWKGLIND PDLDGSFRID 
KGLRLARQVL AAVNNLGLPA ATEFLDLITP QYIADLVAWG AIGARTTESQ IHRELASGLS 
CPIGFKNGTD GNVRIAAEAV KSATQPHHFM AVTKGGRNAI AATTGNNDCH VILRGGVAPN 
FDAASVEAAA AVLGKVGIAP RLMIDASHAN SSKQPENQPK VAADVARQVA AGDARIIGMM 
IESNLVAGRQ EVVPGKPLTY GQSITDGCID WATTESVLHD LATAVEGRRA ARQPARLQHK 
GAAA