Gene RPD_1520 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1520
Symbol
ID	4022000
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	1694986
End bp	1696131
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	64%
IMG OID	637961715
Product	extracellular ligand-binding receptor
Protein accession	YP_568658
Protein GI	91975999
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.657552
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATAGGT TTCTGACAAC ATGTCTGGCG GCCGCATTTG GGCTCGGCCT GGCCGTGCAG 
GCCAAGGCGG CCGAGCCGAT CAAAATCGGC TCGGTGCTTT CGGTCACCGG CCCGGCCGCC 
TTCCTCGGCG ATCCGGAGCT GAAGACCCTG CAGCTCTATG TCGAGAAGAT CAATCAGGAG 
GGCGGCCTGC TCGGGCGGCC GGTGCAGCTC ATCCATTACG ATGACGGCTC CGACGCCACG 
AAGGCGAATA GTTTCGGCAA GCGCCTGATC GAGGACGACA AGGTCGACGT GCTGATCGGC 
GGCACCACCA CCGGCTCGAC GATGTCGATG GCGCCGCTGG TCGATCGCGC CGGAATCCCG 
TTTATTTCGC TGGCGGGCGG CGTGGTGATC GTCGAGCCGG TGAAGAAATG GATGTTCAAG 
ACGCCGCATA CCGACCGCAT GGCGGCGGAG CGGGTGTTCG GCGACATGAA GAAGCGCAAC 
CTGACCAAGG TCGCGCTGTT GTCGGAGACC AGCGGCTTCG GCCAATCCGG CAAGAAGGAG 
AGCGAGGCGG CGGCGGCGCG GCTCGGCATC ACGCTGGTCG CCAACGAGAC CTACGGTCCG 
AAAGATACCG ACATGAGCCC GCAACTCACC AATATCAGGA GCACGGCGGG GGTGCAGGCG 
CTGTTTATTT TCGGCCTCGG TCAGGGACCG GCGATCGCCA ACAAGAACGC CAAGATGCTC 
GGGCTGAGCC TTCCGATCTA CCATGCGCAT GGCGTGGCGT CGGAGGAGTT CATCAAGCTG 
TCGGATGGCG CCGCCGAGGG CATCCGCCTG CCGGCCGCCG CTCTGCTGGT GGCGAGCAAG 
TTGCCGGACA ACGATCCGCA GAAGCCGATC GCGCTCGGCT ACGCCAAGGC CTACACCGAC 
CGCTACAAGG AAGAGGTCTC GACCTTCGGC GGCCATGCCT ATGACGCGCT GATGATCATG 
GTGTCGGCGA TCAAGCGCGC CGGCGACACC GACAAGAACA AGGTGCGCGA CGCGATCGAG 
CAGACCAAGG ACCATATCGG CGCCGACGGC AAGTTCAACA TGTCGCCGAC CGACCATATG 
GGCCTCGACC TGTCGGCGTT CCGGATACTG GAAGTCCGGA ACGGCGACTG GGTGCTGGTC 
GATTGA

Protein sequence

MNRFLTTCLA AAFGLGLAVQ AKAAEPIKIG SVLSVTGPAA FLGDPELKTL QLYVEKINQE 
GGLLGRPVQL IHYDDGSDAT KANSFGKRLI EDDKVDVLIG GTTTGSTMSM APLVDRAGIP 
FISLAGGVVI VEPVKKWMFK TPHTDRMAAE RVFGDMKKRN LTKVALLSET SGFGQSGKKE 
SEAAAARLGI TLVANETYGP KDTDMSPQLT NIRSTAGVQA LFIFGLGQGP AIANKNAKML 
GLSLPIYHAH GVASEEFIKL SDGAAEGIRL PAAALLVASK LPDNDPQKPI ALGYAKAYTD 
RYKEEVSTFG GHAYDALMIM VSAIKRAGDT DKNKVRDAIE QTKDHIGADG KFNMSPTDHM 
GLDLSAFRIL EVRNGDWVLV D