Gene RPD_0796 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_0796
Symbol
ID	4021270
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	894262
End bp	895482
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	62%
IMG OID	637960986
Product	extracellular ligand-binding receptor
Protein accession	YP_567935
Protein GI	91975276
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATCTGC GCTCCACTTC CGTCTTCACG TCCGCAGGCG CTTTCGCCGC GGTTTTGCTC 
GCCGCCACAT CGGTGGCTGC GGCGGAGAAG AAGTACGATC CCGGCGCCAG CGATACCGAA 
ATCAAGATCG GCCAGACTGT TCCGCATTCC GGTCCGGGTT CGCTGTACGG CGTGCTCGGC 
CGCGTCGGCG AAGCCTATTT CCAGATGCTG AACGAGAAGG GCGGCATCAA CGGGCGCAAG 
GTGAAGTTCC TGACCCTGGA CGATTCCTAC AGCTCCCCGA AGGCGGTGGA GGCGACCCGC 
CGGCTGGTCG AGCAGGAAGA GGTGCTGGCG CTGTATGGCT CGCTCGGCAC CGCGCCGCAG 
ACCGCTGTGC ACAAATACCT CAACAGCAAG AAGGTCCCGC AGCTTCTGCT GAACACCGGT 
GCGTCGAAGT GGAACGACCC GAAGAACTTC AAATGGACCA TGGCGGGCCT GCCGCTGTAC 
CCCACCGAGG CCCGCATCCT CGCCAAACAC GTCGTGAGCG TGAAGCCCGA CGCCAAGATC 
GCGATTCTCT ACCAGAACGA CGATTTCGGT CGTGACTTCC TCGGACCGTT CAAGAAGGTT 
CTGGAAGAAG CCGGCGGCAG GGCCAAGGTG GTCGCCGAGG CCAGCTACGA CCTGACCGAG 
CCGACCATCG ATTCGCAGAT GATCAACCTG TCGAAGTCCG GCGCCGACGT GTTCTACAAC 
ATCACCACCG GCAAGGCGAC GTCGCAGTCG ATCCGCAAAG TGGCCGAGCT CGGCTGGAAG 
CCGCTGCAGT TGTTGTCGGC GGGCTCGACC GGCCGTTCGA TTCTCAACGC CGCCGGCATC 
GAGAATGCGA CCGGTATCGT CGCGATCCGC TACTCCAAGG AGGTCGGTGT GCCGCGATTT 
GAGAACGATC CGGACGTCAA GGCGTTCGAG GAGTTCCGCC AGAAGTATCT GCCGAACGTC 
GACAAGGACA ACACCATCGC CTACGCCGGC TACGGCCAGG TGGTGACGAT GGCCGAGATC 
CTGCGCCGCT GTGGCGACAA CCTCACCCGC GAGAACGTGC TGAAGCAGGC GACCTCGCTG 
AAGGGCTTCC ACTCGCCGTA TTTCCTCGAC GGCATCGAAT ATAGCTACAC GTCGGACGAC 
TACACGCCGA TGAAGACCCT CTACATCTCG ACCTTCAACG GCAAGGACTG GGACATCTCC 
GACAAGCCGG TCACCGAATA A

Protein sequence

MNLRSTSVFT SAGAFAAVLL AATSVAAAEK KYDPGASDTE IKIGQTVPHS GPGSLYGVLG 
RVGEAYFQML NEKGGINGRK VKFLTLDDSY SSPKAVEATR RLVEQEEVLA LYGSLGTAPQ 
TAVHKYLNSK KVPQLLLNTG ASKWNDPKNF KWTMAGLPLY PTEARILAKH VVSVKPDAKI 
AILYQNDDFG RDFLGPFKKV LEEAGGRAKV VAEASYDLTE PTIDSQMINL SKSGADVFYN 
ITTGKATSQS IRKVAELGWK PLQLLSAGST GRSILNAAGI ENATGIVAIR YSKEVGVPRF 
ENDPDVKAFE EFRQKYLPNV DKDNTIAYAG YGQVVTMAEI LRRCGDNLTR ENVLKQATSL 
KGFHSPYFLD GIEYSYTSDD YTPMKTLYIS TFNGKDWDIS DKPVTE