Gene RPD_3871 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3871
Symbol
ID	4024387
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	4310167
End bp	4311390
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	67%
IMG OID	637964075
Product	late embryogenesis abundant protein
Protein accession	YP_570993
Protein GI	91978334
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.396289
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCACG ATGCTCGAAC CCTGGATCAG ATCCGGCGCG ATACGGAACG CGCCCGGGCG 
GGATTGACCG AAACCGTCGG CGAGCTGCGG GCGACCGTCG CCGACACCGC GAGCGACCTG 
CGAGAGCGCT ATTCGCCGCA GGCGATCAAG GACGATGTCA GCCATTACAT CAAGACGCGT 
GGCGAAGAGA TCGCCGACAA GGTCAGCGAC ACCATCCGCA ACAATCCGGT GCAGGCCGTG 
GCGGTCGGCG CGACGCTGGC CTATCCGCTG TGGAAGATTG TGCGCGCGAT TCCGACCCCT 
GTGTTGATGG TCGGCGCCGG CCTTTATCTC GCCGGCTCGA AGTCCGGCCA GCAATTGACA 
CAGCGTGCGT CTGACGCGGC GGTCGATCTC GCCGGGGACG TCGAGCGTCG GGCCCGCGCG 
TTCGGCTCCG ACGCCGTCGA CACCGCAGAA GCCGCCAAGG AATATGCGAC CGGCGCGGTG 
CAGGCTGTGG GCGAGGCCGC CACCAGCCGC GCCAATGAAT TCCGTCGCGC CGCGATTTCC 
ACTGCCGCCG ATTTGAAGAA CAAAGGCGAG CAGTTCGGTC GCAATGTTTC GGCGCAGGTC 
GACGACCTTG GTCGCACCGC GGCCGCCGCG GGTGGGGCTT TCGCCGGGGA AGTCGACGAT 
GTCGCGGGCC GTGGCGCCGG CATTGCCGGG GCTGTGACAG ATACGCTCCG TGACACTGCG 
GCCTCGGTGC GCGACGCCGC AGCGTCGGTC CGTGACAACG CCGCGGATGC AGCGATGCGG 
CTGCGTGACA AGGTCGGCGA AACGGCAGAT TCCGGACTCG ATGCGGCTGT GCGGGTTCGC 
GAGCGCGCGA CCGATCTAGG CAATCGCGCC GGCAAGAGCT TCACGGAAAC CGTGAGCAAT 
CACCCGCTGC TGGTCGCCGG CATCGGCCTC GTGGTCGGCG GTCTGATCGC GAGTGCGATC 
CCGCGGCTGC GCGCCGAGAG GCAGGTGTTT GGAAATGCCG GTCGGAGGAT GCGGGACCAG 
GCCGAGGACA CGATGGCGCG CGGCGTCGAA ACGGTGAAGC AGAAGGGGCG CGACGTCTAT 
GAAAGCGCGG TCAACGCCGC CGAAGACGAG GGGCTGACGC GCGAGAAGAT GGGCGATCAG 
GTCCGCGATC TCGGCGACCG AGCCCGCAAG GTTGCCGAAG CCGCGGTCTC GACGTTCGAG 
TCGCCGTCGC AGAACAAGCA TTGA

Protein sequence

MAHDARTLDQ IRRDTERARA GLTETVGELR ATVADTASDL RERYSPQAIK DDVSHYIKTR 
GEEIADKVSD TIRNNPVQAV AVGATLAYPL WKIVRAIPTP VLMVGAGLYL AGSKSGQQLT 
QRASDAAVDL AGDVERRARA FGSDAVDTAE AAKEYATGAV QAVGEAATSR ANEFRRAAIS 
TAADLKNKGE QFGRNVSAQV DDLGRTAAAA GGAFAGEVDD VAGRGAGIAG AVTDTLRDTA 
ASVRDAAASV RDNAADAAMR LRDKVGETAD SGLDAAVRVR ERATDLGNRA GKSFTETVSN 
HPLLVAGIGL VVGGLIASAI PRLRAERQVF GNAGRRMRDQ AEDTMARGVE TVKQKGRDVY 
ESAVNAAEDE GLTREKMGDQ VRDLGDRARK VAEAAVSTFE SPSQNKH