Gene RPD_4394 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_4394
Symbol
ID	4024919
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	4860342
End bp	4861562
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	63%
IMG OID	637964603
Product	extracellular ligand-binding receptor
Protein accession	YP_571511
Protein GI	91978852
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCATCC GCATCACACT GCTTGCCGCA GGCGCTGTTG CGCTCGCCGC GGCCCAACCC 
GCCTTCGCCC AGAAGCAATA CGGCCCCGGC GTCACCGACA CCGAGATCAA GATCGGTCAG 
ACGATGCCCT ATAGCGGCCC GGCTTCGGCG TATGGCGTGC AGGGCCACAT CGAGGACGCC 
TACTTCGCGA TGGTCAACGC CAAAGGCGGC GTCAACGGCC GCAAGATCAA GCTGATCAGC 
CTCGACGACG CCTACTCGCC GCCCAAGACA GTGGAGCAGA CGCGCCGTCT GGTCGAGCAG 
GACGAGGTGC TGGCGATCGT CGGCACGATC GGCACGCCGA CGAATTCCGC GATCCAGAAA 
TATCTCAACG GCAAGAAAGT GCCGCACATC TTCCTCTCCA CCGGGGCTGC GAAGTGGGAC 
GATCCGAAGA ACTTCCCATG GACCACGCAG CTCTATCCGC CCTACCAGAT GGAGGGCATG 
ATCTTCGCGA AGTATCTGCT GAAGAACAAG CCCGACGCCA AGCTCGGCGT GTTCTCGCAG 
AACGATGACG CCGGCAAGGA CTACGTCAAG GGCCTGAAGG ACGGCCTCGG CGACAAGGCC 
AAGACGATGA TCGTCAAGGA GGTCACCTAC GAGGTCACCG ATCCGACCGT CGACTCGCAG 
ATCGTCGCGC TGAAGGCCTC GGGCGCCGAT ACGCTGTTCA CGATGGCGAC TCCGAAATTC 
GGCGCGCAGG CGATCCGCAA GGTCCATGAA CTCGGCTGGA AGCCGCTGAA CTTCGTCGTC 
AGCGTCTCCA GCTCGATCAA GGGCGCGTTG CAACCCGCCG GCATCGAGGC TTCGACCGGC 
CTGCTGACCG CGCTGGCGGC GAAGACGCCG ACCGACCCGC GCTTCGAGAA CGACGCCGAC 
GTCAAGGAGC TGAAGGATTT CCTGGCAAAG TGGTATCCGA AAGGCGACAT CGCCGACGGC 
AGCACCGTGA CCGGCTACAT CTCCGCTTTC ATGACGGTGA AGGTGCTGGA AGCCTGCGGA 
GACAATCTCA CCCGCGAAAA CCTGCTGAAG CAGGCGACCA ACATCCCGCC GACCGCCGCG 
CCGCTGTTGC TGCCCGGCAT CAAGATCTCG ACACGGCCGG ATCGCTACGC GCCGTACACC 
CAGATGCAGA TCGCCCGTTT CGACGGAAGA AGCTGGGTGC CGGAAGGCGA GGTGTTCAAC 
ACCGACACTG CGGCGAAGTA G

Protein sequence

MSIRITLLAA GAVALAAAQP AFAQKQYGPG VTDTEIKIGQ TMPYSGPASA YGVQGHIEDA 
YFAMVNAKGG VNGRKIKLIS LDDAYSPPKT VEQTRRLVEQ DEVLAIVGTI GTPTNSAIQK 
YLNGKKVPHI FLSTGAAKWD DPKNFPWTTQ LYPPYQMEGM IFAKYLLKNK PDAKLGVFSQ 
NDDAGKDYVK GLKDGLGDKA KTMIVKEVTY EVTDPTVDSQ IVALKASGAD TLFTMATPKF 
GAQAIRKVHE LGWKPLNFVV SVSSSIKGAL QPAGIEASTG LLTALAAKTP TDPRFENDAD 
VKELKDFLAK WYPKGDIADG STVTGYISAF MTVKVLEACG DNLTRENLLK QATNIPPTAA 
PLLLPGIKIS TRPDRYAPYT QMQIARFDGR SWVPEGEVFN TDTAAK