Gene RPB_2078 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_2078
Symbol
ID	3909893
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	2361791
End bp	2363077
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	72%
IMG OID	637883970
Product	Orn/DAP/Arg decarboxylase 2
Protein accession	YP_485695
Protein GI	86749199
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0019] Diaminopimelate decarboxylase
TIGRFAM ID	[TIGR01048] diaminopimelate decarboxylase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.192664
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGCCC CGGCCGCGTT CGATCCCGAT CGGGTCGCGA CGCTCGCCGC GCGCCACGGC 
ACGCCGCTGT TCATCTACGA CGCGCCGGCG ATGCGCGCCG CCGCGGCGCG ATTGCAGGAG 
GCGCTGCCGC CGGGCGCGCG ATTGTTCTTC GCGGTGAAGG CCAATCCCGC GCCCGATGTG 
ATCCGGCTGT TCGCCGGCGA GGGCCTCGGC GCCGAAGTGG CGTCGGGCGG CGAATTGCGG 
CTCGCGCTCG CCTGCGGCGT CGCGCCGGAT CGCATCGTGT TCTCCGGCCC GGCGAAGACC 
GCGCCGGAGC TGCGCTGCGC GATCGAGGCC TGCATCTTCG CGGTGCAGGC GGAATCCGTC 
GCCGAGCTCG ACACGCTGCA GGCGCTGTGC GTCGCGCGCG GCGCGACGGT GCGCGTCGCC 
CTGCGCGTCA ATCTCGGGCC GGGCGGCGAA CGCCGCGGCG GCTGGGGCGG GCCTTCGCCG 
TTCGGCATGG ATACCGACGC GCTGGACGAG GTCACAGCGC GCGCCGCGCG GCTCGATCGT 
CTGCGCATTG TCGGCCTGCA CAATCACCAG GCGTCGCAGA CGCTCGATCC GGCGAAGCTG 
ATCGCGCGGT TCGACGCCTT TGCGCGCGTG GCGGCGTCGC TCGGGTCGCG CTTCGATCTG 
CAGTTCGTCA ATTTCGGCGG CGGCTTCGGT GCGCCGTTCT ACGCCGACGA CGCGCCGCTC 
GATCTCGCGC CGGTCCGCGC GTGTTTCGCC GCGCTCGCCG GCGTGTTCGG CGACCGGCCG 
CTGCAGTTCG CCGCCGAATC CGGGCGCTAT CTCGTCGGGC CCGCGGGCTG CTACGTCGCG 
CGCGTGGTCG ATGTGAAGCG GTCGTTCGGC GTGCGCTACG CGCTGCTCGA CGGCGGCATT 
CATCACGTGC TCGGCCTGTC CGGAACGATG CGGTCGCTGC GCCGGCCGGT GGCGGTGGCG 
CGGGTCGGCG CGCGATCGGG GGAGCCTTGC GAGCCGACCG AAATCGCCGG GCCGCTGTGC 
ACGCCGATCG ATCGCCTCGC CGGCGCCGCC GAGCTGCCGT GCGATCTCGC CGCCGGCGAC 
CTGCTGGCGT TCGCCAATTG CGGAGCCTAT GCCAAGCACG CGAGCCCGCT GAACTTCCTC 
GGCCACGACT GGCCGGCCGA ACTGATGATC GACGGCGCGC GCGTCATCGT CCTGTCGCCG 
CAAATTGCAT TCGGGCCGGC GCTGTGGCAA TCACGCGAGG TACTCCAGCG ATTTCGATGC 
GATGGCAAAA TCCCCACGAG CTCCTGA

Protein sequence

MSAPAAFDPD RVATLAARHG TPLFIYDAPA MRAAAARLQE ALPPGARLFF AVKANPAPDV 
IRLFAGEGLG AEVASGGELR LALACGVAPD RIVFSGPAKT APELRCAIEA CIFAVQAESV 
AELDTLQALC VARGATVRVA LRVNLGPGGE RRGGWGGPSP FGMDTDALDE VTARAARLDR 
LRIVGLHNHQ ASQTLDPAKL IARFDAFARV AASLGSRFDL QFVNFGGGFG APFYADDAPL 
DLAPVRACFA ALAGVFGDRP LQFAAESGRY LVGPAGCYVA RVVDVKRSFG VRYALLDGGI 
HHVLGLSGTM RSLRRPVAVA RVGARSGEPC EPTEIAGPLC TPIDRLAGAA ELPCDLAAGD 
LLAFANCGAY AKHASPLNFL GHDWPAELMI DGARVIVLSP QIAFGPALWQ SREVLQRFRC 
DGKIPTSS