Gene RPB_1705 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_1705
Symbol
ID	3908230
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	1940200
End bp	1941177
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	65%
IMG OID	637883599
Product	3,4-dihydroxyphenylacetate 2,3-dioxygenase HpaD
Protein accession	YP_485324
Protein GI	86748828
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0346] Lactoylglutathione lyase and related lyases
TIGRFAM ID	[TIGR02295] 3,4-dihydroxyphenylacetate 2,3-dioxygenase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.159333
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.870304
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTGTGC CGCAGCACGT ATTCGACCCG CCGTTCAACA TCATCCGTTG CAGTCACGTC 
GTGCTCGACG TCACCGACCT TTCCGCCAGC GTCGATTTCT ATGCCGACAT CATCGGCCTG 
CATGTCGAGG ATCGCGACGA CGCCACCGCC TATCTACGCG GCAGCGAGGA GCATCAGCAT 
CACTCGGTGG TACTGCGCCA GGCGGACAAG CCGGCCGCGG CGCGGCTCGG CTTTCGCGTC 
GGCACCGAAG CCGATCTCGA CAAGGCCGGC AGCTTCTTCG CCGAGAATGG GCTGATCTAC 
AGCTTCGTCG ATCGCCCATT CCAGGGCCGC ACGCTGCACG TCACCGACCC GTTCGGCTTC 
CGGCTCGAGT TCTGCGCCAG CATGGAGAAG CGGCCGCATC TTCTGCGCCG CTACGAATTG 
TACAAAGGCT GTCACCCGCA GCGGCTCGAC CATTTCAACG TCTTCGCGGC CGAGACTCAG 
GAGACCATCG ACTTCTACGC CCGGCTCGGC TTTCGCCTCA CCGAATACGC CGAAGAGGAC 
GGCGACAACG GCCGCATCGC CGCGGCCTGG ATGCATCGCA AAGGCAACGT CCACGACTTC 
GCCGTCACCA ACGGCCGCGG CCCGCGGCTG CATCATTTCG CCTATTGGGT GCCCGGTCCG 
CTCAACATCA TCCATCTCTG CGACGTGATG GCGTCGCGGG GGCTCGGCCT CGAGCGCGGC 
CCGGGCCGCC ACGGCATCTC GAACGCCTTC TTTCTCTACG TCCGCGATCC CGACGGCCAT 
CGTATCGAGC TGTATTGCAG CGACTATCAG ACCATGGACC ACGACCACGC CCCGCTGCGC 
TGGTCGCTAC GCGACCCGCG CCGGCAGACG CTGTGGGGCG CGCCGGCGCC GCGCTCCTGG 
TTCGAGCAGG GCTCGGATTT CCTCGGCGAG ACGGTTCGCG AGCCGGCATT CGTGGCCGAT 
GTGATGATTG CGGATTGA

Protein sequence

MPVPQHVFDP PFNIIRCSHV VLDVTDLSAS VDFYADIIGL HVEDRDDATA YLRGSEEHQH 
HSVVLRQADK PAAARLGFRV GTEADLDKAG SFFAENGLIY SFVDRPFQGR TLHVTDPFGF 
RLEFCASMEK RPHLLRRYEL YKGCHPQRLD HFNVFAAETQ ETIDFYARLG FRLTEYAEED 
GDNGRIAAAW MHRKGNVHDF AVTNGRGPRL HHFAYWVPGP LNIIHLCDVM ASRGLGLERG 
PGRHGISNAF FLYVRDPDGH RIELYCSDYQ TMDHDHAPLR WSLRDPRRQT LWGAPAPRSW 
FEQGSDFLGE TVREPAFVAD VMIAD