Gene RPD_3324 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3324
Symbol
ID	4023834
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	3683658
End bp	3685466
Gene Length	1809 bp
Protein Length	602 aa
Translation table	11
GC content	66%
IMG OID	637963528
Product	dihydroxy-acid dehydratase
Protein accession	YP_570449
Protein GI	91977790
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism
COG ID	[COG0129] Dihydroxyacid dehydratase/phosphogluconate dehydratase
TIGRFAM ID	[TIGR00110] dihydroxy-acid dehydratase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAAGA TCACCCCGGG GACTGCCCGG CGCAAGCTCC GCTCCAGCGA ATGGTTCAAC 
GACCCGCACA ACCCCGCGAT GACCGCGCTG TATCTCGAGC GCTATCTGAA CTACGGGCTG 
ACCCGCGGCG AGCTGCAATC CGGCAAGCCG ATCATCGGCA TCGCGCAAAC CGGAAACGAT 
TTGTCGCCGT GCAACCGCCA TCATCTGGAA TTGGCGCAGC GTGTCCGCGA AGGCATCCGC 
GCCGCCGGCG GCATCGCGAT GGAATTCCCG GTGCATCCGA TCCAGGAAAC CGGCAAGCGG 
CCGACTGCGG CGCTCGATCG CAATCTCGCT TATCTCGGCC TGGTCGAGAT CTTGTTCAGC 
TATCCGCTCG ACGGCGTGGT GCTAACCACA GGTTGCGACA AGACCACGCC AGCCTGCCTG 
ATGGCGGCGG CGACCGTCAA CATCCCGGCG ATCGTGCTGT CCGGCGGGCC GATGCTGAAC 
GGCTGGCACA ATGGCGAACG CTCCGGATCG GGCACAGTGG TCTGGAAATC CCGCGAGCGC 
CTCGCCGCCG GCGAGATCGA CTACGAAGAG TTCATGGAGA TCGTCGCATC GTCGGCGCCG 
TCGGTCGGCC ATTGCAACAC CATGGGCACC GCCTCGACGA TGAACTCGCT GGCGGAAGCG 
CTCGGCATGT CGCTGCCGGG CTGCGCCGCG ATTCCTGCGC CCTATCGCGA ACGCGGCCAG 
ATCGCCTACG CCACCGGCCT GCGGGCGGTG GAGATGGTGT GGGAGGATCT GAAGCCGTCC 
GACATCCTGA CCCGCAAAGC TTTCGAGAAC GCCATCGTCG TCAATTCGGC GATCGGCGGC 
TCGACCAACG CGCCGATCCA TCTCAATGCA CTCGCCCGCC ACATCGGCGT CGAGCTTTCG 
ATCGACGACT GGCAGAGCGT CGGCCACGCC ATTCCGCTGC TGGTCAACAT GCAGCCGGCC 
GGCTTCTATC TCGGCGAGGA GTATCACCGC GCCGGCGGCG TGCCGGCGGT GGTCCGCGAA 
CTGATGAGGC ACGGCAAAAT TCATACGGAC GCGATCACCG TCAACGGCCG TACCATGGGC 
GACAATTGCG CGTCGGCCCC CGCCCCCGAT GGCGAGGTGA TCAAGTCCTA CGACGGGCCG 
CTGGTGCAGG ACGCCGGATT CCTGGTGCTG CGCGGCAATC TGTTCGACTC GGCGATCATG 
AAGACCAGCG TGATCTCGCT GGAATTCCGC GAGCGCTATC TCGCCAATCC GAACGATCCG 
AACGCGTTCG AGGGCCGCGC CATCGTGTTC GAAGGGCCGG AAGACTATCA CGACAGGATC 
GACGATCCGG CGCTCGACAT CGATGAGCAT TGCATCCTGT TCGTGCGCGG CACCGGGCCG 
ATCGGCTATC CCGGTGGCGC CGAGGTGGTG AACATGCAGC CGCCGGCGGC GCTGATCAAA 
CGCGGCATCC ACTCGCTGCC CTGCATCGGC GACGGCCGCC AGTCCGGCAC CTCGGGCTCG 
CCCTCGATCC TGAACGCGAC ACCAGAAGCC GCCGCCAATG GCGGGCTCGC GATCCTCAAG 
ACCGGCGACC GCGTCCGCGT CGACCTGAAC AAAGGGAGCG CCAACATTCT GATATCGGAC 
GATGAACTGC GGCAGCGCCG CGCCGACCTC GAGGCGCATG GCGGCTTCGC CTATCCGAAG 
CATCAGACGC CGTGGCAGGA GCTGTATCGC GCCACGGTCG GCCAGCAGGC CACCGGCGCC 
TGCCTCGAAC TCGCCACCCG CTATCGCGAC ATCGCCGGCA CCGTCGGCGT CGCGCGGCAC 
AATCATTGA

Protein sequence

MNKITPGTAR RKLRSSEWFN DPHNPAMTAL YLERYLNYGL TRGELQSGKP IIGIAQTGND 
LSPCNRHHLE LAQRVREGIR AAGGIAMEFP VHPIQETGKR PTAALDRNLA YLGLVEILFS 
YPLDGVVLTT GCDKTTPACL MAAATVNIPA IVLSGGPMLN GWHNGERSGS GTVVWKSRER 
LAAGEIDYEE FMEIVASSAP SVGHCNTMGT ASTMNSLAEA LGMSLPGCAA IPAPYRERGQ 
IAYATGLRAV EMVWEDLKPS DILTRKAFEN AIVVNSAIGG STNAPIHLNA LARHIGVELS 
IDDWQSVGHA IPLLVNMQPA GFYLGEEYHR AGGVPAVVRE LMRHGKIHTD AITVNGRTMG 
DNCASAPAPD GEVIKSYDGP LVQDAGFLVL RGNLFDSAIM KTSVISLEFR ERYLANPNDP 
NAFEGRAIVF EGPEDYHDRI DDPALDIDEH CILFVRGTGP IGYPGGAEVV NMQPPAALIK 
RGIHSLPCIG DGRQSGTSGS PSILNATPEA AANGGLAILK TGDRVRVDLN KGSANILISD 
DELRQRRADL EAHGGFAYPK HQTPWQELYR ATVGQQATGA CLELATRYRD IAGTVGVARH 
NH