Gene RPD_4056 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_4056
Symbol
ID	4024573
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	4508065
End bp	4509249
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	64%
IMG OID	637964259
Product	extracellular ligand-binding receptor
Protein accession	YP_571176
Protein GI	91978517
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.423392
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.164952
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGTCATC TTTCCATTGT TGCAGCCGCA GCCCTCACGC TGACCGCGAC GGTCGCCGCC 
CGAGCCGACG ACCTCAAGAT CGCGCTGATC TACGGCAAGA CGGGACCGCT CGAAGCCTAC 
GCCAAGCAGA CCGAAACCGG CCTGATGATG GGCCTCGAAT ACGCGACCAA GGGCACGATG 
ACGCTCGACG GCCGCAAGAT CAAGGTGATC ACCAAGGACG ATCAGAGCAA GCCCGACCTC 
TCCAAGGCCG CGCTCGCCGA AGCCTATCAG GATGACGGCG CCGACATCGC GATCGGCACC 
TCGTCGTCGG CGGCGGCGCT GGCGGACCTG CCGGTCGCCG AAGAGAACAA GAAAATCCTG 
ATCGTCGAGC CCGCGGTCGC CGACCAGATC ACCGGCGAGA AGTGGAATCG CTACATCTTC 
CGCACCGGCC GCAATTCCTC GCAGGACGCG ATCTCCAACG CGGTCGCAAT CGGCAAGCAA 
GGCGTCACCA TCGCCACGCT GGCGCAGGAC TACGCGTTCG GCCGCGACGG CGTCGCCGCC 
TTCAAGGAGG CGCTGACCAA GACCGGCGCG ACGCTCGCCG CCGAGGAATA TGTTCCGACC 
ACCACCACCG ACTTCACCGC GGTCGGGCAG CGGTTGTTCG ACACGCTGAA AGACAAGCCC 
GGCAAGAAGA TCATCTGGGT GGTCTGGGCC GGCGGCGGCG ATCCCTTGAC CAAGCTGCAG 
GACATGGACC CGAAGCGCTA CGGCATCGAA CTGTCCACCG GCGGCAACAT CCTGCCGGCA 
CTCGCCGCCT ACAAGCGACT GCCCGGCATG GAAGGCGCGA CCTATTACTA TTACGACATC 
CCGAAGAACC CGATCAACGA CTGGCTGGTG ACCGAGCATC AGAAGCGCTT CAACGCGCCG 
CCGGATTTCT TCACCGCCGG CGGTTTCTCC GCGGCGATGG CGGTGGTCAC CGCCGTGCAG 
AAGGCGAAAT CGACCGACAC CGAGAAGCTG ATCGCGGCGA TGGAAGGCAT GGAGTTCGAC 
ACGCCGAAGG GCAAGATGAT GTTCCGCAAG GAAGACCATC AGGCGCTGCA GAGCATGTAT 
CACTTCAAGG TCAAGGCCGA TCCGAACCTC GCCTGGGCCG TGCTCGAGCC GGTGCGGGAG 
CTGAAGATCG AGGACATGAC GATCCCGATC AAGAACAAGC GGTAA

Protein sequence

MRHLSIVAAA ALTLTATVAA RADDLKIALI YGKTGPLEAY AKQTETGLMM GLEYATKGTM 
TLDGRKIKVI TKDDQSKPDL SKAALAEAYQ DDGADIAIGT SSSAAALADL PVAEENKKIL 
IVEPAVADQI TGEKWNRYIF RTGRNSSQDA ISNAVAIGKQ GVTIATLAQD YAFGRDGVAA 
FKEALTKTGA TLAAEEYVPT TTTDFTAVGQ RLFDTLKDKP GKKIIWVVWA GGGDPLTKLQ 
DMDPKRYGIE LSTGGNILPA LAAYKRLPGM EGATYYYYDI PKNPINDWLV TEHQKRFNAP 
PDFFTAGGFS AAMAVVTAVQ KAKSTDTEKL IAAMEGMEFD TPKGKMMFRK EDHQALQSMY 
HFKVKADPNL AWAVLEPVRE LKIEDMTIPI KNKR