Gene RPD_2976 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_2976
Symbol
ID	4023479
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	3315413
End bp	3316690
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	64%
IMG OID	637963175
Product	aminodeoxychorismate lyase
Protein accession	YP_570103
Protein GI	91977444
COG category	[R] General function prediction only
COG ID	[COG1559] Predicted periplasmic solute-binding protein
TIGRFAM ID	[TIGR00247] conserved hypothetical protein, YceG family

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.202928
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGAAA GGCCGCCGAT CTCGCCGAGA AGCCCGCGTG CGGCGCTGGA ACCGGAGCAA 
CTCCCGCCGC CGCCGAAGCG GTCCGATCGG GCGCGCAGCC CGTTGGTCAT CATCGGCAAC 
GCCATCATCA CCATCCTGCT CGTCCTGATG ATCGGTGCCG GCGGCATCTA CGTCTACGGC 
AAGCAGAAGA TCGAGGCGGC CGGTCCGCTG CAGGAAGACA AGGTTGTTAA TATTCCGCAG 
CGTGCGGGGC TCGGCGATAT CGCCGAGATC CTGCAGCGTG AAGGCGTGAT CGAGAACAAT 
CGCTGGGCTT TCATCGGCAG CGTGTTGGCC TTGAAGGCGC GTTCGGAACT GAAGCCCGGC 
GAATATTCGT TCCATAAGAA GGCCAGCCTG CGCGACGTCA TCGGCACCAT CGTTGAGGGC 
AAGGTGGTGC AGCACACCGT GACGATTCCG GAAGGCCTGA CCTCGGAACA AATCGTTGCG 
CGGTTGTCCG AGAACAACAT CTTCAGCGGA AGCCTGCGCG AAATCCCGCG CGAGGGAACG 
CTGTTGCCGG AGACCTACAA ATTCCCGCGC GGGACGATGC GCGATCAGGT GATCAATCGG 
ATGCAGCAGG CTCAGAAGCG CGTGCTCGCA GAAGTCTGGG AGCGGCGCAA CCCGGAAATT 
CCGATCAAGT CGCCGGAGCA ATTGGTGACG CTCGCGTCGA TCGTGGAGAA GGAGACCGGC 
AAGGCGGATG AGCGCAGCCG GGTCTCGTCG GTGTTCATCA ATCGACTGCA GAAGAAGATG 
AAGCTGCAGT CCGATCCGAC GATCATTTAC GGCCTGGTCG GCGGCAAGGG CACGCTTGGA 
CGGCCGATCA AGCGCAGCGA AATCCAGCAG CCGTCCCCGT ACAACACCTA TGTCATCGAC 
GGCCTGCCGC CGGGGCCGAT TGCCAATCCC GGTCGTGCGT CGCTCGAGGC CGTGGCGAAT 
CCGGCCCGCA CGCGCGATCT CTATTTCGTC GCCGACGGCA CCGGCGGTCA CGCCTTCAGC 
GACGGCTACG ATCAACACTT GAAGAACGTG GCGAAGCTGC GTGCGCAGGA ACGCCAGATG 
CAGAACGACA CCGTCGAGCC GGCGGAGGAC GCTCCGCCGA CGGCAACGAT TACTCCCGAT 
GCCGACGGCT CGGCGGCCGC GCCGGCGGCG GTGCCCAAGC CCGCGAAAAA TGCCGGGACG 
CCGAAGAAGC GAACGCGGAA CGGGACGCAA AACAGCGCCG CCCCAACTGG CGCGCCGGCG 
GCGGCAGACC AGGACTAG

Protein sequence

MSERPPISPR SPRAALEPEQ LPPPPKRSDR ARSPLVIIGN AIITILLVLM IGAGGIYVYG 
KQKIEAAGPL QEDKVVNIPQ RAGLGDIAEI LQREGVIENN RWAFIGSVLA LKARSELKPG 
EYSFHKKASL RDVIGTIVEG KVVQHTVTIP EGLTSEQIVA RLSENNIFSG SLREIPREGT 
LLPETYKFPR GTMRDQVINR MQQAQKRVLA EVWERRNPEI PIKSPEQLVT LASIVEKETG 
KADERSRVSS VFINRLQKKM KLQSDPTIIY GLVGGKGTLG RPIKRSEIQQ PSPYNTYVID 
GLPPGPIANP GRASLEAVAN PARTRDLYFV ADGTGGHAFS DGYDQHLKNV AKLRAQERQM 
QNDTVEPAED APPTATITPD ADGSAAAPAA VPKPAKNAGT PKKRTRNGTQ NSAAPTGAPA 
AADQD