Gene RPD_3559 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3559
Symbol
ID	4024073
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	3957460
End bp	3958716
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	65%
IMG OID	637963763
Product	extracellular ligand-binding receptor
Protein accession	YP_570683
Protein GI	91978024
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0888701
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGAGACC CACCAATGCT TTTCTGCTTT TCGCGTCGCG CGCTGTTGTT CGCGACGCTC 
GCCACACTTT CCGCCGTAGC CCCCATTGCC GTTGCGCCGC CGGCGCTGGC GCAGAAGACC 
TACGACCCAG GCGCCAGTGA CAGCGCGATC CGGATCGGAA ATCTGATGCC CTATTCGGGA 
CCCGCCTCCG CTTACGCCAT CGTCGGCCGG ATCGAGCAGG CCTATTTCAG GATGATCAAC 
GACCAGGGCG GCATCAACGG CCGCAAGATC GAGTTCATTT CCTATGACGA CGCCTACAGC 
CCGGCGAAGG CGGTCGAGCA GACCCGCAAG CTGGTCGAGA GCGACGAGGT GCTGCTGGTA 
TTCAGCGCGA TGGGCACGCC CTCGAACGCC GCGATCCAGA AATATCTTAA TGCCAAGCAA 
GTGCCGCAAT TATTCGCCGC CAGCGGCGCG ACGCGGTTCG GCGAGCCCAA GGCGTTCCCC 
TGGACGATGG GCTGGCAACC GCCCTATCAG GTCGAAGGCC GGGTCTACGC CAAGCATATT 
CTGGCGACCA AGCCCGAAGC CCGCATCGCG GTGCTGTATC AGAACGATGA TCTCGGCCGC 
GATCTGCTGA AGGGCCTGAA GGATGGGCTC GGCGAACAGG CATCGCGGAT CATCGCCGAG 
GAAAGCTATG AGGTGACCGA GCCCTCCGCC GACAATCACA TCGCGCGGTT GAAAGCCTCG 
GGCGCCGATG TGTTCGTCAG CATCACCACG CCGCGGTTCG CTGCGCAGAG CATCCGCAAG 
GCCGCCGAGA TGGCGTGGCG TCCGCTCTAT GTGCAGGCGC TGGTGTCGGC CTCGATCGGC 
GCGGTGATCC GGCCCGCCGG CATCGAGAAC GCGCAGGGAC TGGTCTCCGC GGCCTACAAC 
AAGGACGCCG CCGATCCGCA ATGGATCGGC GATCCCGGCA TCAAGCGGTT CCACGCCTTC 
CTCGATGCCT ACGCCCCGGA CGTCAATCGC GGCGACAATT CGGTGGTCTA CGGATACGGT 
GCGGCGCAAT GCCTCGTCGA AGTGCTGCGC CGCGCGGGCG ACACGCTGAC GCGCGCCAAT 
GTGATGCGCG AGGCCGCCAA CCTCAAAGGC TACGCGCCCG ACACGCTGCT GCCGGGCATC 
GCCATCACCA CCGCACCCGA CGATTTTCAC CCGATCGAAC AGCTGCGCAT GATGCGCTTC 
GAAGGCGACC ACTGGCAATT GTTCGGGCCG GTGATCGACG CGCAGCTGCG CAACTAA

Protein sequence

MRDPPMLFCF SRRALLFATL ATLSAVAPIA VAPPALAQKT YDPGASDSAI RIGNLMPYSG 
PASAYAIVGR IEQAYFRMIN DQGGINGRKI EFISYDDAYS PAKAVEQTRK LVESDEVLLV 
FSAMGTPSNA AIQKYLNAKQ VPQLFAASGA TRFGEPKAFP WTMGWQPPYQ VEGRVYAKHI 
LATKPEARIA VLYQNDDLGR DLLKGLKDGL GEQASRIIAE ESYEVTEPSA DNHIARLKAS 
GADVFVSITT PRFAAQSIRK AAEMAWRPLY VQALVSASIG AVIRPAGIEN AQGLVSAAYN 
KDAADPQWIG DPGIKRFHAF LDAYAPDVNR GDNSVVYGYG AAQCLVEVLR RAGDTLTRAN 
VMREAANLKG YAPDTLLPGI AITTAPDDFH PIEQLRMMRF EGDHWQLFGP VIDAQLRN