Gene RPD_1994 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1994
Symbol
ID	4022476
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	2230793
End bp	2232427
Gene Length	1635 bp
Protein Length	544 aa
Translation table	11
GC content	67%
IMG OID	637962187
Product	hypothetical protein
Protein accession	YP_569130
Protein GI	91976471
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGTCA CCGCCAATCT CGGATTGCCC TTTATCGCGG CGAGCCAGGC GCAGAAGCAC 
GTCACCCACA ACGAGGCGCT GTTCAGCCTC GACGGCCAGG TTCAACTCGC CGTGCTGTCG 
GCGGCGCTGG CGACGCCGCC GGCCTCGCCG GACGATGGCG AGCGCTGGAT CGTGCCGGCC 
GGCGCGAGCG GCGCGTGGGC CGGGAAAGCC GCGCAGATCG CGGCCTGGTA CGACGGCGGC 
TGGCGGTTCT TCGCGCCCCG GCCGGGTTGG CTCGCCTACA ATCTCGCGAC GCAGACGCTG 
CTGGCGTGGA CCGGCGCAGC CTGGGTGAAC GCGCTGGCGG CGTTTCAGAA CCTGCCGATG 
TTCGGCCTCA ATACCACCGC CGATGCGAGC AATCGGCTTG CGGTGAAATC CGACGGCGTG 
CTGTTCGGCA ATGACGACGT CACCCCGGGC AGCGGCGACG TCCGCGTCAC ATTGAACAAG 
AGCGACGCGG CGAAAGACGC CGGGCTGACG CTGCAGAATA ATTGGAGCAC GCGGGCGCAG 
CTCGGGCTGC TCGGCGACGA CAATTTCCAC ATCAAGGTCA GCGCAAACGG CTCTGCGTTC 
ACCGATGCGA TCCAGATCGA CAGGACCACC GGCAATGTCG GCATCCGCAC CGCGCCGAGC 
AGCGGCGGCA ATGCGTTGCA GGTCGCCGGC TCGAACGCAT TGTTCAGCAA CAGCGCCGGC 
GGGTTCTCCT TCACCTTCAG CAAGGCCGCC ACGGCCCACG ACGCCGCTTT GTATCTGCAG 
ACCAACTACA GCACCAAGGC GCTGTTCGGC CTGCTCGGGC TCGACGATTT TTCGCTGAAG 
GTGACGCCGG ACGCCGCAAA TTACTACGCA GGACTTCGGG CGTGGTCGGC GCTGCACGGC 
CGGCTCGACA TCAAGGATGC GCGGCGCAGG CAGCCGATGC ATTGGTCGCC GCGGCCGGGC 
AGCACCATGC TCGACAGCAT CGGGCTTGGC GCGTCGATCA CCGGCGCCGC GACCGCGGTG 
TCGCCGTCGT CGGGCAATCT GTTTCTGTCG GCCCCGCGGC TCGATTTCAA CTCCGCCGCC 
ACGGCCGGCG CCAGCGCTGG CGTCAACGGA TCGGCGCTGA CGTTGTGGCG CGGCAACGGC 
GGCGGTCTCG GCGGTTTCTA TCTGCTGATG CGGTTCGGCA TCGAGACGTT CCAGTCGAAT 
TGCCGGCTGT TCGCCGGGCT GGTCGGCTCC GCTGGCGCGA TCGGCAACGT CAATCCGAGC 
ACGTTGTCGA ACCTGATCGG CGTCGGCTTC GATTCCGGCG ACGCGACGCT GTCGCTGATC 
AGCAATGACG GCAGCGGCGC AGCGACCAAG ACGGGCCTCG GCGCCGGCTT TCCGACCACC 
GGCGGACAAG ACCTGTACGA ACTGCTGCTG TCGGCCGAGC CGAACGGCAG TGAGGTTCGC 
TACCGCGTCG AGCGGCTGAA TTCCGGCGAC GTCGCCAGCG GCGTTGTGAC GACCAATCTG 
CCCGTCAACA CGCAGTTTCT GACGCCGCAT CTGTGGATGA ACAACGGCAC CAGCGCCGGC 
GCGGTCAGCG TGGCGCTGGT GCAGATGTAT TGCGAGCCGG CGGCGTTGCT CGGCTCGCGC 
GGACTGATCG GTTAG

Protein sequence

MTVTANLGLP FIAASQAQKH VTHNEALFSL DGQVQLAVLS AALATPPASP DDGERWIVPA 
GASGAWAGKA AQIAAWYDGG WRFFAPRPGW LAYNLATQTL LAWTGAAWVN ALAAFQNLPM 
FGLNTTADAS NRLAVKSDGV LFGNDDVTPG SGDVRVTLNK SDAAKDAGLT LQNNWSTRAQ 
LGLLGDDNFH IKVSANGSAF TDAIQIDRTT GNVGIRTAPS SGGNALQVAG SNALFSNSAG 
GFSFTFSKAA TAHDAALYLQ TNYSTKALFG LLGLDDFSLK VTPDAANYYA GLRAWSALHG 
RLDIKDARRR QPMHWSPRPG STMLDSIGLG ASITGAATAV SPSSGNLFLS APRLDFNSAA 
TAGASAGVNG SALTLWRGNG GGLGGFYLLM RFGIETFQSN CRLFAGLVGS AGAIGNVNPS 
TLSNLIGVGF DSGDATLSLI SNDGSGAATK TGLGAGFPTT GGQDLYELLL SAEPNGSEVR 
YRVERLNSGD VASGVVTTNL PVNTQFLTPH LWMNNGTSAG AVSVALVQMY CEPAALLGSR 
GLIG