Gene RPD_2094 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_2094
Symbol
ID	4022576
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	2343389
End bp	2345137
Gene Length	1749 bp
Protein Length	582 aa
Translation table	11
GC content	65%
IMG OID	637962287
Product	hypothetical protein
Protein accession	YP_569230
Protein GI	91976571
COG category	[R] General function prediction only
COG ID	[COG0433] Predicted ATPase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.429967
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGAAG CTGTTTCCGC TCCGGCGTTC GGCAAGATCA TCTCGGTGCG CGGGTCGATG 
GCGCGCGCGG GCCTGTTGCC CGAAAAGCAC CTGTCGCCTG CCGCAATCCG GGCCACGGTC 
GGCCGCTTCA TCAGCATCCG TACGGCGAGT TCCACCATCA TCGCGATCAT CACCGAAGTA 
TCGTGTGAAG ACGTGGTCGG CGACCAGTAC AGCGCCAGCG CCTCGGTCGA TCTGCTCGGC 
GAAATCCTGC CCGGTCCGGC GCGCGCGAAG TTTCAGCGCG GCGTCACCAA CTATCCGACG 
ATCGGCGACG CGGTCGAAAT GATCACCAGC GAAGACCTGC GCGTCGTTTA TGCGCCGACC 
GGCTCCGACC AGATCAATGT CGGCACGCTG CAGCAGGACC CGTCGGTGAT CGCCTATGTC 
GACATCGAGG AAATGCTGTC GAAGCACTTC GCGGTACTCG GCTCGACCGG CGTCGGCAAA 
TCGACCGGTG TATCGCTGCT GCTCAACGAG ATCCTGAAAT CTCGGCCGGC CTTGCGCGTC 
TTCCTGCTCG ACGTTCACAA CGAGTACGGC CGTTGCTTCG GCGATCGCGC GCTGGTGCTC 
AACCCGCGCA ACCTCAAGCT GCCGTTCTGG CTGTTCAACT TCGATGAAAT CGTCGACGTG 
CTGTTCGCCG GCCGCCCGGG CGTTCCGGAA GAACTCGACG TCCTCGCCGA GGTGATCCCG 
ATCGCGAAGG GCCTGTACGT GCAGTACACC AACGCCGACC GGATCGGGCT GAAGCGGATG 
GATCCGAAGT CGGTCGGCTA TACCGCCGAC ACGCCGGTGC CGTATCGCCT TGTCGATCTG 
ATCTCGCTGA TCGACGAGCG CATGGGCAAG CTCGAGAACC GCTCGTCGCG CATCATCTAT 
CACAAGCTGA TCTCGCGCAT CGAGACCGTG CGCAACGACC CGCGCTACGC TTTCATGTTC 
GACAACGCCA ATGTCGGCGG CGACACCATG GCGGAGGTGA TCAGTCACCT GTTCCGGCTG 
CCCGCCAATG GTCGCCCGAT GACGATCATG CAGCTCGCCG GCTTCCCGGC CGAGGTCGTC 
GACTCGGTGG TGTCGGTGCT GTGCCGGATG GCGTTCGATT TCGGGCTGTG GAGCGACGGC 
GTCTCGCCGC TGCTGTTCGT CTGCGAGGAA GCGCATCGCT ACGCGGCCGC CGACCGTTCG 
ATCGGTTTCG GCCCGACCCG CAAGGCGGTG TCGCGGATCG CCAAGGAAGG CCGCAAATAC 
GGCGTCTATC TCGGCTTGGT GTCCCAGCGC CCGGCGGAAC TCGACGCGAC GATCCTGTCC 
CAGTGCAACA CGCTGTTCGC GATGCGGCTC GCCAACGACC GCGACCAGTC GCTGCTGCGC 
TCGGCGGTGT CGGACGCTGC CGCCAATCTG TTGTCGTTCG TGCCTTCGCT CGGAACCCGC 
GAAGTGCTGG CGTTCGGCGA AGGCGTCGCG CTGCCGACCC GGCTGCGCTT CAAGGAAGTG 
CCAGTGCAGC AATTGCCGCG TTCGGAAGCG GCGATCTCGA CCGTGCCGTC GGCGACCGCG 
GGCCACGACA TGCATTTCGT CAGCGCGGTG CTGGAACGCT GGCGAGGCGC CACCTCGCAT 
CGCGACATTC CGAACGATCC AGGCGTGGTC GAGCGGCCGC TGGCACGCAC CATGGACGCT 
CCGATGCTGC AGCCCTCGCT CGGGCTCGAT CCCGACCGTT TCTCGCTGCT GAAGAAGCCG 
CTGCGCTGA

Protein sequence

MAEAVSAPAF GKIISVRGSM ARAGLLPEKH LSPAAIRATV GRFISIRTAS STIIAIITEV 
SCEDVVGDQY SASASVDLLG EILPGPARAK FQRGVTNYPT IGDAVEMITS EDLRVVYAPT 
GSDQINVGTL QQDPSVIAYV DIEEMLSKHF AVLGSTGVGK STGVSLLLNE ILKSRPALRV 
FLLDVHNEYG RCFGDRALVL NPRNLKLPFW LFNFDEIVDV LFAGRPGVPE ELDVLAEVIP 
IAKGLYVQYT NADRIGLKRM DPKSVGYTAD TPVPYRLVDL ISLIDERMGK LENRSSRIIY 
HKLISRIETV RNDPRYAFMF DNANVGGDTM AEVISHLFRL PANGRPMTIM QLAGFPAEVV 
DSVVSVLCRM AFDFGLWSDG VSPLLFVCEE AHRYAAADRS IGFGPTRKAV SRIAKEGRKY 
GVYLGLVSQR PAELDATILS QCNTLFAMRL ANDRDQSLLR SAVSDAAANL LSFVPSLGTR 
EVLAFGEGVA LPTRLRFKEV PVQQLPRSEA AISTVPSATA GHDMHFVSAV LERWRGATSH 
RDIPNDPGVV ERPLARTMDA PMLQPSLGLD PDRFSLLKKP LR