Gene RPD_1898 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1898
Symbol
ID	4022380
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	2131309
End bp	2132544
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	61%
IMG OID	637962091
Product	extracellular ligand-binding receptor
Protein accession	YP_569034
Protein GI	91976375
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.193262
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGGCAC TCTCCCGATC AATCGCGACC CTGGCAACCG CTGCCCTTCT GTCCGCCGCT 
GGCGGCCAAG CGATAGCGCA GAAAAAATAC GGCCCCGGCG CCAGCGACAC CGAAGTCAAG 
ATCGGCAACA TCGTGCCCTA TAGCGGCCCG GCTTCGGCCT ATGGCAGCGT CGGCCGGGCA 
CAAGAAGCCT ATTTCAAGAT GATCAACGAC AAGGGCGGCA TCAACGGCCG CAAGATCGTC 
TACATCTCCT ACGACGACGC CTATTCGCCG CCGAAGTCGG TCGAGCAGAC CCGCAAGCTG 
GTCGAGAGCG ACGAAGTGCT GTTCATGTTC AGCCCGCTCG GCACGCCGTC CAACACGGCG 
ATCCAGAAAT ATCTCAACGT CAAGAAGGTG CCGCATTTGT TCCTGGCGTC GGGCGCCACC 
AAATGGAACG ACCCGAAGCA CTTCCCGTGG ACGATGGGCT GGCTGCCGAG CTACCAGAGC 
GAAGGCCGGA TCTACGCCAA ATATCTGCTG AAGGAAAAGC CGGGCGCGAA GATCGCTGTG 
CTGTATCAGG GCGACGATTT CGGCAAGGAC TATCTCAAGG GCCTGAGGGA TGGTCTCGGC 
GACAAGGCGT CCTCGATCGT GGTCGAAGAC AGCTACGAAC TGACCGAGCC GACCGTCGAT 
TCCCACATCG TCAAGATCAA GGCAGCGGCG CCCGACGTGC TGGTGATCTT CGCCACGCCG 
AAATTCGCCG CGCAGACCAT CAAGAAGGTC GCTGAACTTG CCTGGAAGCC GATGATGATC 
GTGCCGAACG TCTCGGCCTC GACCGGCAGC GTGATGAAAC CCGCCGGCTT CGAGAATGCC 
CAGGGCATCG TCTCCGCCTC CTACGCCAAG GACGCCACCG ACAAGCAGTG GGAAAACGAC 
CCCGGCATGA AGGAATACTA CGACTTCCTG GCGAAGCACG CGCCGCAGGC CAGCCGCGCC 
GATTCGTCGT TCACCACCGG CTACAACATC GCCGAAACCG TCGCGATCCT GATCAAGCAG 
TGCGGCGACG ATCTCACCCG CGAGAACGTG ATGAAACAGG CCGCCAACCT GAAGGACATT 
CAGCTCGGCG GGCTGCTGCC GGGCATCAAG CTCAACACCA GCGCAACCGA TTTCTCACCG 
ATCGAACAGC TGCAACTGAT GCGGTTCGAG GGCGAGAACT GGAAGCTGTT CGGCGACGTG 
ATCGAAGGCG AAGTCGCCGC ACCGACCGGC GGCTAG

Protein sequence

MSALSRSIAT LATAALLSAA GGQAIAQKKY GPGASDTEVK IGNIVPYSGP ASAYGSVGRA 
QEAYFKMIND KGGINGRKIV YISYDDAYSP PKSVEQTRKL VESDEVLFMF SPLGTPSNTA 
IQKYLNVKKV PHLFLASGAT KWNDPKHFPW TMGWLPSYQS EGRIYAKYLL KEKPGAKIAV 
LYQGDDFGKD YLKGLRDGLG DKASSIVVED SYELTEPTVD SHIVKIKAAA PDVLVIFATP 
KFAAQTIKKV AELAWKPMMI VPNVSASTGS VMKPAGFENA QGIVSASYAK DATDKQWEND 
PGMKEYYDFL AKHAPQASRA DSSFTTGYNI AETVAILIKQ CGDDLTRENV MKQAANLKDI 
QLGGLLPGIK LNTSATDFSP IEQLQLMRFE GENWKLFGDV IEGEVAAPTG G