Gene RPB_4630 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_4630
Symbol
ID	3912447
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	5232143
End bp	5233294
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	65%
IMG OID	637886534
Product	extracellular ligand-binding receptor
Protein accession	YP_488224
Protein GI	86751728
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.511173
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAACAGA CCAAGACTCT GATCGTCGCG CTGGCGACGA TGCTGGCCGG TGTGACTGCG 
GCGCAGGCCG AGATCAAGAT CGGCATCACC ATGAGCGCGT CCGGCCCCGG CGCCGCGCTC 
GGCCAGCCGC AATCCAAGAC GGTGGCGGCG CTGCCCAAGG AAATCGGCGG CGAGAAAGTG 
ACCTACTTCG CGCTGGACGA CGAATCCGAT CCGACCAAGG CGGCGCAGAA TGCCCGCAAG 
CTGCTGTCGG AAGAGAAGGT CGACGTGCTG ATCGGCTCGT CGCTGACCCC GGTGAGCCTG 
CCGCTGATCG ACATCGCCGC CGAAGCCAAG ACGCCGCTGA TGACGATGGC GGCGGCCGCG 
ATCCTGGTCG CGCCGATGGA TGAGCGGCGC AAATGGGTCT ACAAGGTGGT GCCGAACGAC 
GACATCATGG CGGAGGCGAT CGGCAAATAC ATCGCCAAGA CCGGCGCCAA GAAGGTCGGC 
TATATCGGCT TCTCCGACGC CTACGGCGAA GGCTATTACA AGGTGCTCGC CGCCGCGGCG 
CCCAAGCTCG GCTTCGAACT CACCACCCAC GAGGTCTATG CGCGCAGCGA TGCCAGCGTC 
ACCGGCCAGG TGCTGAAGAT CATCGCCACC AAGCCCGACG CGGTGTTCAT CGCCTCTGCC 
GGAACGCCGG CGGTGCTGCC TCAGAAGGCG CTGCGCGAGC GCGGCTTCAA GGGGGCGATC 
TATCAGACCC ACGGCGTCGC CACCGAGGAA TTCATCAAGC TCGGCGGCAA GGACGTCGAA 
GGCGCGATCT TCGCCGGCGA GGCGTTCTCG GGCGCCGAGG ATATGCCGGC CGACAGTCCG 
TTCCGCAAGG TCAAGGCGCG CTTCGTCGAC GCCTACAAGG CCGCCAATGG CGGCGCGGCG 
CCGACCATTT TCGGCGTACA TCTGTGGGAT TCGATGACGC TGGTCGAGAA CGCGATTCCC 
GCGGCGCTCA AGGCTGCCAA GCCCGGCACG CCGGAATTCC GCGCCGCGAT CCGCGACCAG 
ATCGAGAAGT CGAAGGACCT CGCGCTCAAC AACGGCCTGT CGAATATGAC GCCCGACAAC 
CATAACGGCT ATGACGAGCG CTCCGCATTC CTGATCGAGA TCCGCGACGG CGCGTTCCGG 
TTGAAGCAGT AA

Protein sequence

MQQTKTLIVA LATMLAGVTA AQAEIKIGIT MSASGPGAAL GQPQSKTVAA LPKEIGGEKV 
TYFALDDESD PTKAAQNARK LLSEEKVDVL IGSSLTPVSL PLIDIAAEAK TPLMTMAAAA 
ILVAPMDERR KWVYKVVPND DIMAEAIGKY IAKTGAKKVG YIGFSDAYGE GYYKVLAAAA 
PKLGFELTTH EVYARSDASV TGQVLKIIAT KPDAVFIASA GTPAVLPQKA LRERGFKGAI 
YQTHGVATEE FIKLGGKDVE GAIFAGEAFS GAEDMPADSP FRKVKARFVD AYKAANGGAA 
PTIFGVHLWD SMTLVENAIP AALKAAKPGT PEFRAAIRDQ IEKSKDLALN NGLSNMTPDN 
HNGYDERSAF LIEIRDGAFR LKQ