Gene RPB_0233 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_0233
Symbol
ID	3907860
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	266445
End bp	267473
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	68%
IMG OID	637882115
Product	oligopeptide/dipeptide ABC transporter, ATP-binding protein-like
Protein accession	YP_483855
Protein GI	86747359
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4608] ABC-type oligopeptide transport system, ATPase component
TIGRFAM ID	[TIGR01727] oligopeptide/dipeptide ABC transporter, ATP-binding protein, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGCTC AGCAACAGAA CCACGCCGAC GCCGGCATTC TCGCGGTGCG CGATCTGCGC 
ATCCTGTTTC CGTCGCGCGA TGGCCGGGAC ACCGTCAAGG CGATCGACGG TATGGATTTC 
GAGGTCCGCA GCGGCGAGAC GTTCGGCATC ATCGGCGAAT CCGGCTCCGG CAAGACCACG 
CTCGGGCGCG CTCTGGTGTC GCTGCTGCGG CCGACTCACG GCCACATCCT GCACGACGGC 
ACCGATCCGG CGACGCTCGG CAGCCGGGCG TTCCGCAAGC ATCGCCGCGA CTATCAGATC 
ATCTTTCAGG ATCCGAATGC CGCGCTCAAT CCGCGGATGA CGATCATCGA CAGCGTTGTC 
GAGCCGCTGG AAGTTCTCGG TGAGGGCAAC GCCGCCTCGC GCCGCCGTCG CGGCATCGCG 
GTGCTGGAGC GCGTCGGGCT CTCCGCCGAG GCGGCCGATC GCTATCCGCA TCAGCTCTCG 
GGCGGCCAGA AGCAGCGCGT CAACATCGCG CGGGTGCTGA CGCTGCGACC CAAGGTGATC 
GTCTGCGACG AGGTCGTCGC GGCGCTCGAC GTCTCGATTC GCGGCGACGT GCTCAACCTG 
TTCGCCGATC TGCAGCGCGA ATTCGGCCTC ACCTATGTGT TCATCACCCA CGACATTTCG 
GTGGTGTCGC ACATCTCCGA TCGCATCGCG GTGACCTACC TCGGCAAGCT GATGGAGCTC 
GGCCCCGCCG AGGACGTCGT CGAGCGGCCG CTGCATCCCT ACACGCGCGC GCTGCTCTCA 
GCCGAGCCGA TCCCGCTGCC GTCGCATCTG CGGGTCGATC GCCGCATCAT TCTCGAAGGC 
GAGATTCCGA GCCCGGTATC GCCGCCGTCG GGCTGCCGCT TCCGCACGCG CTGCCCGTCG 
GTGCAGCCGC GTTGCGCAGA CGAGGTGCCG GCCTGGCGCG ACGTCAGGCC GGGCCATCGC 
GTCGCCTGTC ACTTCGCGAC GGCCGAAGGG CCGCCGGCCG ACAATCAACA GGCGCGATCC 
GCGTCGTAA

Protein sequence

MAAQQQNHAD AGILAVRDLR ILFPSRDGRD TVKAIDGMDF EVRSGETFGI IGESGSGKTT 
LGRALVSLLR PTHGHILHDG TDPATLGSRA FRKHRRDYQI IFQDPNAALN PRMTIIDSVV 
EPLEVLGEGN AASRRRRGIA VLERVGLSAE AADRYPHQLS GGQKQRVNIA RVLTLRPKVI 
VCDEVVAALD VSIRGDVLNL FADLQREFGL TYVFITHDIS VVSHISDRIA VTYLGKLMEL 
GPAEDVVERP LHPYTRALLS AEPIPLPSHL RVDRRIILEG EIPSPVSPPS GCRFRTRCPS 
VQPRCADEVP AWRDVRPGHR VACHFATAEG PPADNQQARS AS