Gene RPB_4091 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_4091
Symbol
ID	3911898
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	4661320
End bp	4662426
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	68%
IMG OID	637885995
Product	phosphonate metabolism
Protein accession	YP_487695
Protein GI	86751199
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3626] Uncharacterized enzyme of phosphonate metabolism
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.658015
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0458753
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTATGTCG CCGTCAAGGG TGGCGAGCGC GCCATCGACA ACGCCCACCG GCTGCTGGCG 
CACGAGCGCC GCGGCGACCG CGCCGTGCCT GAACTGACAC TGGCGCAGAT TTCCGAACAG 
CTCGCGCTCG GCGTCGACCG GGTGATGGTC GAGGGCTCGC TGTATGACCG CGAGTTGGCG 
GCACTCGCCA TCAAGCAGGC CCGCGGCGAT CTGATCGAGG CGATCTTCCT GCTGCGCGCA 
TTCCGCGCCA CGCTGCCCCG GTTCGGCGCC ACCGAACCGC TCGACACCGG CGCGATGGCG 
GTGCGGCGGC GGGTGTCCTC GACCTTCAAG GATATTCCCG GCGGGCAGAT TCTCGGACCG 
ACCTTCGACT ACACCCATCG GCTGCTCGAT CCGCAACTCG CCGCAGGCGG CGAGCCGGAT 
CAGCCGGTCA ATGCGGAGGT GTCGAACGAA GCGATGCCGC GCGTCACCGA TATCCTCGGC 
CGCGACGGAC TGATCGAGCC GTCGCCCGCG CCGGCCCCCG ATGCGCCGGT CGGCGACCTC 
ACCCGCGAGC CGCTGAACTT TCCGGCGGAT CGCGATCTGC GGCTGCAAAA TCTGGCGCGC 
GGCGACGAGG GCTTCCTGCT CGCGCTCGGC TACTCGACGC AGCGTGGCTA TGGCCGCTCG 
CATCCGTTCG CCGGCGAAAT CCGCTTCGGC GAAGTCGAAC TGGAGTTCGT CGCCGAGGAC 
GTCGGCTTCG CGGTGCCGCT CGGCAGCATC GCGCTGACAG AATGCCAGAT GGTCAATCAG 
TTCAAGGGTT CGGCCACAGA GCCGCCCTGC TTCACCCGCG GCTACGGCCT CGCCTTCGGG 
CAGAGCGAGC GCAAGACCAT GGCGATGGCG CTGGTCGATC GTGCGCTCCG CGCCAAGGAA 
CTCGGCGAGG AGGCGCTGGC GCCGGCGCAG GACGAGGAAT TCGTGCTGTC GCATTCCGAC 
AATGTGCAGG CGACCGGCTT CGTCGAACAT CTGAAGCTGC CGCATTATGT CGACTTCCAG 
TCCGAGCTCG GACTGATCCG CCGGCTGCGG CAGGATTTTG CCGATGCCGC CGAGCAAGCG 
GATGCGTTGC GGGAGGCCGC GGAATGA

Protein sequence

MYVAVKGGER AIDNAHRLLA HERRGDRAVP ELTLAQISEQ LALGVDRVMV EGSLYDRELA 
ALAIKQARGD LIEAIFLLRA FRATLPRFGA TEPLDTGAMA VRRRVSSTFK DIPGGQILGP 
TFDYTHRLLD PQLAAGGEPD QPVNAEVSNE AMPRVTDILG RDGLIEPSPA PAPDAPVGDL 
TREPLNFPAD RDLRLQNLAR GDEGFLLALG YSTQRGYGRS HPFAGEIRFG EVELEFVAED 
VGFAVPLGSI ALTECQMVNQ FKGSATEPPC FTRGYGLAFG QSERKTMAMA LVDRALRAKE 
LGEEALAPAQ DEEFVLSHSD NVQATGFVEH LKLPHYVDFQ SELGLIRRLR QDFADAAEQA 
DALREAAE