Gene RPC_4601 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_4601
Symbol
ID	3972092
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	-
Start bp	5134291
End bp	5135508
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	71%
IMG OID	637927712
Product	late embryogenesis abundant protein
Protein accession	YP_534442
Protein GI	90426072
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCCAAG CCGATTCTCG ATCCTTGGAA GAGATACGTC GCGACGCCGA ACTCGCGCGG 
GCGGGCCTGA CTGCGACCGT CGATCAGCTG AAATCCACGG TGACGGACAC CGCGCAGGAT 
TTCCGCGAAC GCTACTCGCC GGACGCCATC AAGGCCGAGG TCTCCGGCTA CATCAAGAGC 
CGCGGCGAAG CCATGATCGA CAGCGTGACC GACGCGATCC GCAATAACCC GCTGCAGGCG 
CTGGCGATCG GCGCCAGCAT CGCGGTGCCG CTGCTGCGCG TGGTGAGGAC GATTCCCGCG 
CCGGTGCTGA TGGTCGGCGC CGGGCTTTAT CTGGCCGGGA CCAAGCGCGG CCAGGATGTG 
GCGCGTCAGG CCAATGACGC CGCCATGGAG CTGGCCGGCG AAGTCGGTCG CCGCGCCCGC 
GACATCGGCG CCGAGGTCGG CGAGGCTGCG GCCGCCACCC GCGATTACGC CGCCGATCGC 
TACGCCGCCG CCAGCGAGGC GGTTGCGGTC GGCACCGAAC AGCTCAAGGG CAAGGCCGCG 
GAACTCGGTG CGACGATCTC GTCCACCGTC GACGGGCTGC GTCACCAGGC CAACGACGCC 
GGCGACCGGA TTTCCGACGA GGTGTCGGAG TTGTCGGAGC GCGGCTCGCG CAGCGCCGCC 
GAGGCGGTCG ACTCGGTCCG CGACTCCGCC TCGACGGTGC GGCAGGCCGC CGCGTCGATG 
CGCGAAACCG CCGCCGAAGC CGCGGCGCGT TTGCGGCAGA CGGCCTCGGC TTCGGTCGAC 
GCCGGTCGCG ACGCCGCAGC CATTGCACGG GATCGCGCCG CGGATCTGGC GCATCGCGCG 
GCCCGAGCCG GCGATCGGGC CGGGCGCACG CTGATGGACA CGGCGACGCA GAACCCGCTT 
CTGGTCGCCG GCATCGGTCT GGTGCTGGGT GGACTGATTG CCAGTGCGTT ACCGCGCTCG 
CGGATCGAAG ATCGGCTGGT CGGCGGCACC GCCCGCGGCC TCAAGGAGCG GGCGCGCGAT 
GTCGCGGCGC AGAGCGTCGA AGGCGTCAAG GAGGCGGTGA GCGGCGCTTA TCAGGAAGTC 
AGCCGCGCTG CCGAGCAGGA AGGGCTGACT CCGGACGGTG TTGCCGGGGC CGCCGGCGAT 
CTCGGGCAGC GGGCCCGCAA GGTGGCGGAG GCCGCGACCG GTTCGTTCGA CCGACCATCG 
TCGCACAACA AGCATTGA

Protein sequence

MAQADSRSLE EIRRDAELAR AGLTATVDQL KSTVTDTAQD FRERYSPDAI KAEVSGYIKS 
RGEAMIDSVT DAIRNNPLQA LAIGASIAVP LLRVVRTIPA PVLMVGAGLY LAGTKRGQDV 
ARQANDAAME LAGEVGRRAR DIGAEVGEAA AATRDYAADR YAAASEAVAV GTEQLKGKAA 
ELGATISSTV DGLRHQANDA GDRISDEVSE LSERGSRSAA EAVDSVRDSA STVRQAAASM 
RETAAEAAAR LRQTASASVD AGRDAAAIAR DRAADLAHRA ARAGDRAGRT LMDTATQNPL 
LVAGIGLVLG GLIASALPRS RIEDRLVGGT ARGLKERARD VAAQSVEGVK EAVSGAYQEV 
SRAAEQEGLT PDGVAGAAGD LGQRARKVAE AATGSFDRPS SHNKH