Gene RPD_3561 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3561
Symbol
ID	4024075
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	3960396
End bp	3961625
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	59%
IMG OID	637963765
Product	extracellular ligand-binding receptor
Protein accession	YP_570685
Protein GI	91978026
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCTTTT CCAGTTCGAG ACTGGCTGTT CTCTCGGCCG CCGCAATGCT GTTTGCGGCG 
TCCAGCCACG GCGCCCTTGC CCAGAAGAAA TACGACCCCG GTGTCAGCGA CACCGAAATC 
AAGATCGGCA ATGTCGAGGC CTATAGCGGT CCGGCCTCGG CTTACGGCGT CATCGGCAAG 
ACCGAGGACG CCTATTTCAA GATGATCAAC GATCAGGGCG GCATCAACGG CCGCAAGATC 
AAGTTCATCA GCTATGACGA CGCCTACTCG CCGCCAAAGA CGGTGGAACA GGTCCGCAAG 
CTGATCGAGA GTGACGAAGT GTTCCTGGTG TTCAACGCGC TCGGCACGCC GACCCAGACC 
GCGGTGCAGA AGTATCACAA CGTCAAGAAG GTCCCGCAAT TGTTCGTTGC AACCGGCGCG 
AGCAAATGGA ACGACCCGAA GGACTTCCCC TGGTCTATGG GCTTCCAGCC GAGCTACCGC 
GTCGAAGCGC GAGTCTTCGC CAAGTACATT CTCAAGGAGA AACCGAACGC CAAGGTCGCG 
GTGTTCTACG CAAATGACGA TTTCGGCAAG GACTATCTGA TCGGGCTCAA GGACGTGTTC 
GGCGCCAACA GCTCGAAAAT CATCGTCGCC GAGGAAAGCT ACGAGACCTC CGAGCCGTCA 
ATCGACGCCC ATATCGTCAA GCTGAAGGGC ACCGGCGCCG ACGTGTTCGT CAACATCTCG 
ACGCCGAAAT TCGCCGCCCA GGCGATCAAG AAGATGGCCG AGCTCGACTG GAAGCCGATG 
CACCTGATGA CCGACGTGTC GATTTCGATC GGCGCGGTGA TGAAGCCCGC CGGCCTCGAC 
GCCTCGGAGG GCGTGCTGTC CGCAGGCTAC CTCAAGGACG CCTCGGATTC GCAGTGGGAC 
AACGACGAGG GCATGAAGAA ATTCAAGGCC TTCCTCGACA AGAACATGCC CGGCGCCAAT 
ATCGCCGATA CCAACCTCGT CTACGGCTAT ACCGCAGCGC AAACCATGGT GCAGGTGCTG 
AAGCAGGCCG GCGACAATCT GACCCGCGAG AACGTGATGA AGCAGGCGGC CAGCATCAAG 
GACTTCGCCG CCGACACCCT GCTGCCTGGG ATCAAGATCA ATACCTCGGC GACCGACTTC 
GCACCGATCG AGCAACTGCA GATGATGCGG TTCACCAAGG GCAAGTGGGA GATGTTCGGC 
GAGATCATCA GCGCCGAAAC CGGCGGCTGA

Protein sequence

MSFSSSRLAV LSAAAMLFAA SSHGALAQKK YDPGVSDTEI KIGNVEAYSG PASAYGVIGK 
TEDAYFKMIN DQGGINGRKI KFISYDDAYS PPKTVEQVRK LIESDEVFLV FNALGTPTQT 
AVQKYHNVKK VPQLFVATGA SKWNDPKDFP WSMGFQPSYR VEARVFAKYI LKEKPNAKVA 
VFYANDDFGK DYLIGLKDVF GANSSKIIVA EESYETSEPS IDAHIVKLKG TGADVFVNIS 
TPKFAAQAIK KMAELDWKPM HLMTDVSISI GAVMKPAGLD ASEGVLSAGY LKDASDSQWD 
NDEGMKKFKA FLDKNMPGAN IADTNLVYGY TAAQTMVQVL KQAGDNLTRE NVMKQAASIK 
DFAADTLLPG IKINTSATDF APIEQLQMMR FTKGKWEMFG EIISAETGG