Gene Rru_A2302 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rru_A2302
Symbol
ID	3835730
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodospirillum rubrum ATCC 11170
Kingdom	Bacteria
Replicon accession	NC_007643
Strand	-
Start bp	2663888
End bp	2664937
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	62%
IMG OID	637826404
Product	periplasmic binding protein/LacI transcriptional regulator
Protein accession	YP_427389
Protein GI	83593637
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0869305
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAAGT TCCTATCGTC CCTGGTGCTC GCGGCGTCGC TTGTCGCCGG TCCGGCCCTG 
GCCGCCGATG CGCCGGTCGA TGTCTCGCAG GTGCCCAAGG GCTTTTCCGC CAAAGACGTT 
GGCAAAAGCT ATTCCATCGC CACCGTGGTC AAGGTCGATG GCATCGCCTG GTTTGACCGC 
ATGCGCGAAG GCGCCAAGCA GTTCGGCGCC GATACCGGCC ATGACACCTG GATGGTCGGG 
CCCAGTCAGG CCGACGCCGC CGCCCAGGTG CAACTGGTCG AGAACCTGAT CGCCCAGGGC 
GTCGACGCCA TCTGCGTCGT GCCCTTCTCG GTCGAGGCCC TGGAGCCCGT GCTCAAGAAG 
GCGCGCGATC GCGGCATCGT CGTCATCGCC CACGAGGCCT CGAACATCAC CAACGCGGAT 
TTCGTGCTCG AAGCCTTCGA CAACCTCGCC TATGGCGCCA AGCTGATGGA AGTGCTGGGC 
ACCTATATGA AGGGCGAAGG CAAGTATGTG ACGACGGTCG GCAGCCTGAC CTCGAAGTCT 
CAGAACGAAT GGATCGACGG CGCCATCGCC TATCAGAAGG CCCATTTCCC CAAGATGGAG 
CAGGCGACCG GCCGGCTCGA GACCTATGAC GACGCCAATA CCGACTACAA CAAGCTCAAG 
GAAGTGCTGA CCACCTATCC CGATATCAAG GGCATCCTTG GTGGTCCGAT GCCGACCTCG 
GCCGGCGCCG GTCGCCTGAT TTCGGAACGC GGCCTGAAGG ACAAGCTGTT CTTCGCTGGC 
ACCGGTCTGG TTTCGGTCGC GGGCGAATAT TTGTCCAAGG GCGATATCCA GTACATCCAG 
TTCTGGGATC CGGCGGTGGC CGCCTATGCG ATGAACATCG TCGCGGTGAT GGCCCTTGAC 
GGCAAGGCCG ATCAGATCAA GGCCGGCCTC AATCTGGGCC TGCCCGGCTA CACCAGCCTG 
ACCGCCCCGG TGGCGGGCAA GGACAAGCTG CTCTATGGCG CGGGCTGGGT CGGCGTGACC 
AAGGACAACA TGGAAGACTA CAACTTCTAA

Protein sequence

MKKFLSSLVL AASLVAGPAL AADAPVDVSQ VPKGFSAKDV GKSYSIATVV KVDGIAWFDR 
MREGAKQFGA DTGHDTWMVG PSQADAAAQV QLVENLIAQG VDAICVVPFS VEALEPVLKK 
ARDRGIVVIA HEASNITNAD FVLEAFDNLA YGAKLMEVLG TYMKGEGKYV TTVGSLTSKS 
QNEWIDGAIA YQKAHFPKME QATGRLETYD DANTDYNKLK EVLTTYPDIK GILGGPMPTS 
AGAGRLISER GLKDKLFFAG TGLVSVAGEY LSKGDIQYIQ FWDPAVAAYA MNIVAVMALD 
GKADQIKAGL NLGLPGYTSL TAPVAGKDKL LYGAGWVGVT KDNMEDYNF