Gene RPD_2989 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_2989
Symbol
ID	4023492
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	3328784
End bp	3329905
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	70%
IMG OID	637963188
Product	hypothetical protein
Protein accession	YP_570116
Protein GI	91977457
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.662915
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGAGCC GGTTGCTCAG TTCGGCGGCT GTATTGCTCC TGATCGGCTC TGTCGTTTCG 
GATCCAGTCC ACGCGCAGAA CCTTGAAGCC GGCAAGAGCC CGTCCCAGAT CTTTGCCGGC 
ACCTGCGCGG CTTGCCACAA GGGCGCCCGT GGTCTGGTGC GGTCGGTGCC TCCGAGCTCG 
CTGGCGTCGT TTCTGCGCCA GCACTACACG ACCAGCAGCG ACATGGCCTC ATTGCTCGCC 
TCGTATCTGA TCTCGAACGG CGCTACCGAC ACCCGCTACA AGCAGAACGA CGCGAAATCC 
GAACCCGGTC AGCCGGAGGG CCGGCAGGGC CGCAGGCAAC GCCCGGTGGC GGGTGAGGCG 
GCCCGGCCCG AAGCTGCCGC GCCCGAGGCG GGCGCTCCTG TGCAGGCCGA AGAGGGCGTC 
CGCCGAAGCC GCAACAGCAA ACGCCAGCCC AAGCCCGAGG CGGACAAGCC GGCCGAAGGC 
GCTGCCGCGG CAGAGACCGC CGCGCCGGCG CCTGCGGAGC AACCGCCGGC GAAGGAACGT 
CGCAAGCACG GTCGGAAGGA CAAGCCCGGA CAGGCCGCGC CTGCTGGCGC CGATGCGGCC 
AAGGGCGAAC CTCAGAAGCC GTCGCCGGCC GCGACCGAGC CGGCCGTCGC GAAGCCAGAT 
ACCACGAAGC CTGACAGCGC CAAACCGGAT GGCGCCAAGC CGGACGAGTC GAAGGCAGGC 
GCTGCGAAAC CAGATGCGCC GAAGACCGAC GCCGCCCCGC CGGACGCTTC CAAGATTGAT 
ACGCCCAAGA CTGACGCTCC CAAGACTGAC GCCTCCAAAC CGGATGCTTC GAAGTCCGAA 
ACGCCGAAGA CCGAGGCTGC GCAGCCCGAC CGCGCAGCGA CGCCCGCTGA GGTGCCGCTG 
CGCCCCGATC CGGTTCCGGC GGTGACGCCG GCCCCGAAGG CCGTCGATAG CTCGAAGACC 
CCTGAGGCCG CTCCGCTTGC TGCGAAGCCG GCGGAGCCGC CCGCGTCCGC GACGACCTCT 
CCGCCCGCCG CAACGACGCC CGGCGAGCCG TCGATCGCCG TGACGCCGAT TCCGCCGCCG 
CCTGCGCAGG GCAGCGCGTC AGATGTTCCG ATCTCCCGTT AA

Protein sequence

MVSRLLSSAA VLLLIGSVVS DPVHAQNLEA GKSPSQIFAG TCAACHKGAR GLVRSVPPSS 
LASFLRQHYT TSSDMASLLA SYLISNGATD TRYKQNDAKS EPGQPEGRQG RRQRPVAGEA 
ARPEAAAPEA GAPVQAEEGV RRSRNSKRQP KPEADKPAEG AAAAETAAPA PAEQPPAKER 
RKHGRKDKPG QAAPAGADAA KGEPQKPSPA ATEPAVAKPD TTKPDSAKPD GAKPDESKAG 
AAKPDAPKTD AAPPDASKID TPKTDAPKTD ASKPDASKSE TPKTEAAQPD RAATPAEVPL 
RPDPVPAVTP APKAVDSSKT PEAAPLAAKP AEPPASATTS PPAATTPGEP SIAVTPIPPP 
PAQGSASDVP ISR