Gene RPB_0222 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_0222
Symbol
ID	3909464
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	250038
End bp	251102
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	68%
IMG OID	637882104
Product	oligopeptide/dipeptide ABC transporter, ATP-binding protein-like
Protein accession	YP_483844
Protein GI	86747348
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4608] ABC-type oligopeptide transport system, ATPase component
TIGRFAM ID	[TIGR01727] oligopeptide/dipeptide ABC transporter, ATP-binding protein, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCAAG CCGCAGAACT CAGCCACGGC CTCGAGCCGA TCGAGGATAT CGGCGGCGCC 
GCGCAGCCGC TGCTGGACGT CAGAGGTCTC ACCAAGCACT TCCCGGTGCG CGGCGGGCTG 
TTCAGCGCCG CCAAGACGGT GCGGGCGGTC GACGACGTTT CGTTCGCGAT CGCCAAGGGC 
GAAACCGTCG GCATCGTCGG CGAATCCGGC TGCGGCAAGT CGACCACGGC GCGGCTGTTG 
ATGCATCTGA TGCCGCGCAA CGCCGGCGAC ATCATCTATG ACGGCCGCGC CGTCGGCCGC 
GAATTATCGC TGCGCGAGCT GCGGCGCGGG ATGCAGATGG TGTTTCAGGA CAGCTACGCG 
TCGCTCAACC CGCGCCTCAC CATCGAGGAG TCGATCGCGT TCGGTCCGAA GGTGCACGGC 
ATGGCCGATG GCACCGCGCG AGCGCTGGCG CGCGAGCTGC TCGGCAAGGT CGGGCTGCGG 
CCGGAGAATT TCGCCAATCG CTACCCGCAC GAAGTCTCCG GCGGCCAGCG CCAGCGCGTC 
AACATCGCCC GCGCGCTGGC GCTGTCGCCG CGGCTGGTGA TCCTCGACGA AGCGGTGTCG 
GCGCTCGACA AATCGGTCGA GGCGCAGGTG CTGAATCTGC TGGTCGACCT CAAGCGCGAA 
TTCGGCCTGA CCTATCTGTT CATCAGCCAC GATCTCAACG TGGTGCGCTA CATCTCGGAT 
CGCGTGCTGG TGATGTATCT GGGCGAAGTC GTCGAGCTCG GGCCGGTCGA CAAGGTCTGG 
GATCAGCCGG CGCATCCCTA TACGCGCGCG CTGCTGGCGG CGATGCCGTC GTCGGATCCC 
GACCGCCGCA CCGAAGTGCC GCCGATTTCC GGCGATCCGC CGAACCCGAT CGATCCGCCG 
TCCGGCTGCC GGTTTCACAC CCGCTGCCCG TTCGCGGAGC CTTTGTGCGG CGGCGACGCG 
CCGAAGCTGA CCGCGCTGGA CCCGAGCGGC CACCAGGCGG CATGCTACAT GGCGATCCCC 
GGCTCGGGCC ACAGCCGGGC GCCGAAAGTG ATGGAGACGA CATGA

Protein sequence

MTQAAELSHG LEPIEDIGGA AQPLLDVRGL TKHFPVRGGL FSAAKTVRAV DDVSFAIAKG 
ETVGIVGESG CGKSTTARLL MHLMPRNAGD IIYDGRAVGR ELSLRELRRG MQMVFQDSYA 
SLNPRLTIEE SIAFGPKVHG MADGTARALA RELLGKVGLR PENFANRYPH EVSGGQRQRV 
NIARALALSP RLVILDEAVS ALDKSVEAQV LNLLVDLKRE FGLTYLFISH DLNVVRYISD 
RVLVMYLGEV VELGPVDKVW DQPAHPYTRA LLAAMPSSDP DRRTEVPPIS GDPPNPIDPP 
SGCRFHTRCP FAEPLCGGDA PKLTALDPSG HQAACYMAIP GSGHSRAPKV METT