Gene RPD_0121 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_0121
Symbol
ID	4020577
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	138971
End bp	140191
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	61%
IMG OID	637960298
Product	extracellular ligand-binding receptor
Protein accession	YP_567262
Protein GI	91974603
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.455844
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAGCC TGTATCGGGC CGCAGCCGCG GCTGTAGCTG CAATCGCTCT CACAGCCGCG 
CCCGCCGCGG CACAGAAGAA ATACGACACC GGCGCCACCG ACACCGAAAT CAAGATCGGC 
CAGACCGTGC CGTTCTCCGG TCCCGCTTCG GCCTATGCCG GTATCGGCAA AACCCAGGCC 
GCCTATATGC GGATGATCAA CGATTCCGGC GGAATCAATG GCCGCAAGAT CAACCTCATT 
CAATATGACG ACGCCTATTC GCCGCCCAAG GCGGTCGAGC AGGTGCGCAA GCTGGTCGAA 
GGCGACGAGG TTCTGCTGAC CTTCCAGATC ATCGGGACGC CGTCGAACGC CGCGGTGCAG 
AAATATCTCA ACGGCAAGAA GGTGCCGCAG CTGCTCGCCT CGACCGGCGC GACCCGCTTC 
ACCGATCCGA AGAGTTTCCC CTGGACGATG GGCTACAACC CGAACTACCA GACCGAAGCC 
CGGATCTATG CGCGCTACAT CCTGAAGAAC CACCCCAATG CCAAGATCGG CATCATGTAC 
CAGAACGACG ACCTGGGGCG TGATTACCTC GCCGGGCTGA AGGCGGGACT CGGCGACAAG 
GCCGCCGCGA TGATCGTGGC GGAGACCTCC TACGAACTGT CCGACCCGAC CGTCGACTCG 
CAGATCGTCA AGCTCAAGGC CGCCGGCGTC GACCTCTTCT TCAACGCCTC GACGCCGAAA 
TTCGCCGCGC AGGCGATCAA GAAGGTCGCC GACCTCGACT GGCGCCCGAT CCACATTCTC 
GACATCAATG CGAGCCCGGT GTCCTCGACG CTGAAACCGG CGGGCCTGGA CATCTCCAAG 
GGCATCATCA GCGTCAATTA CGGCAAGGAC CCGGCCGACC CGCAATGGAA GGACGATCCC 
GGCGTCGCGA AATATCTCGC CTTCATGGAC AAGTACTATC CGGAGGGTGA CAAGATGTCG 
ACGATCAACA CCTACGGCTA CTCGACCGCG CAATTGCTGG TCACCATCCT GAAGCAATGC 
GGCGACGACC TCACCCGCGA CAACGTCATG AAACAGGCGG CGAATCTCAA GAACGTGACC 
GGCGACCTGT CGCTGCCGGG CATGGTGATC AACACCTCGC CGACCGATTA TCGCATCAAC 
AAGCAGCTTC AGATGATGAA GTTCAACGGC GAGCGCTGGG AGCTGTTCGG CCAGATCATC 
GAAGACGACC AAGCGATGTA A

Protein sequence

MKSLYRAAAA AVAAIALTAA PAAAQKKYDT GATDTEIKIG QTVPFSGPAS AYAGIGKTQA 
AYMRMINDSG GINGRKINLI QYDDAYSPPK AVEQVRKLVE GDEVLLTFQI IGTPSNAAVQ 
KYLNGKKVPQ LLASTGATRF TDPKSFPWTM GYNPNYQTEA RIYARYILKN HPNAKIGIMY 
QNDDLGRDYL AGLKAGLGDK AAAMIVAETS YELSDPTVDS QIVKLKAAGV DLFFNASTPK 
FAAQAIKKVA DLDWRPIHIL DINASPVSST LKPAGLDISK GIISVNYGKD PADPQWKDDP 
GVAKYLAFMD KYYPEGDKMS TINTYGYSTA QLLVTILKQC GDDLTRDNVM KQAANLKNVT 
GDLSLPGMVI NTSPTDYRIN KQLQMMKFNG ERWELFGQII EDDQAM