Gene RPB_4216 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_4216
Symbol
ID	3912024
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	4788812
End bp	4789891
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	68%
IMG OID	637886119
Product	ABC transporter related
Protein accession	YP_487818
Protein GI	86751322
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.628741
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGTGA GCCTGGACAA CGTCACCCGG ACGATCGACG GGCTGCCGGC GATCTGCGAC 
GTGTCGCTGA CGCTGGAGCG CGGCACGCTG AGCGTGCTGC TCGGACCGAC GCTGTCCGGC 
AAGACCTCGA TCATGCGGCT GCTCGCCGGC CTCGACAAGC CGAATTCCGG TCGCGTCCTG 
GTCGACGGCC GGGACGTCAC CGGGGCCGAC GTACGCAAGC GCTCGGTGGC GATGGTCTAT 
CAGCAGTTCA TCAACTACCC GTCGCTGACG GTGTACGAGA ACATCGCCTC GCCGCTGCGG 
GTGCAGCGCA AACCGCGCGC CGAGATCGAG CAGCGCGTGC AGGAGGCGGC GCAGCTGCTC 
AAGCTCGAGC CGTATCTGAA GCGCACGCCC TTGCAGCTCT CCGGTGGTCA GCAGCAGCGC 
ACCGCGATCG CCCGGGCGCT GGTCAAGGGC GCGGATCTGG TGCTGCTCGA CGAACCGCTG 
GCCAATCTCG ACTACAAGCT GCGCGAGGAA CTGCGCACCG AACTCCCGCG GATCTTCGAA 
GCCTCCGGCG CGATCTTCGT CTATGCCACC ACCGAGCCGT CCGAGGCGCT GCTGCTCGGC 
GGCCGCACCA TCTGCATGTG GGAGGGCCGG GTGCTGCAGA CCGGGCCGAC ACCGCAGGTC 
TATCGTCGGC CCGACACGCT ACGCGTCGCG CAGGTGTTTT CCGATCCGCC GCTCAACATC 
GTCGGCGCCG AGAAGAAGAG CGGCACCGTG CATTATGCGG GAGGCGTCAC CGCGCCCGCG 
ACCGGCGTCT TCGAAGGCCT CGGCGATGGC GTCTATCGGG TCGGTTTCCG CGCTCACCAG 
ATCGCGGTGG CGCGCGGCGA CGCCGACCGC CACGGCTTTC AGACGACGGT CGCGGTGACG 
GAAATCACCG GCTCGGAGAG CTTCGTGCAT CTGCGGCGCG GCGACGACAA TTGGGTCGCG 
GTGCTGCACG GCGTCCACGA ATTCGAGCCC GGCCAGACGC TCGACGCGGT GCTCGATCCT 
GCCAATCTGT TCGTGTTCGA CGCGGCCGAC CGCCTCGTCG CCGCGCCGAA GCCGATGTGA

Protein sequence

MSVSLDNVTR TIDGLPAICD VSLTLERGTL SVLLGPTLSG KTSIMRLLAG LDKPNSGRVL 
VDGRDVTGAD VRKRSVAMVY QQFINYPSLT VYENIASPLR VQRKPRAEIE QRVQEAAQLL 
KLEPYLKRTP LQLSGGQQQR TAIARALVKG ADLVLLDEPL ANLDYKLREE LRTELPRIFE 
ASGAIFVYAT TEPSEALLLG GRTICMWEGR VLQTGPTPQV YRRPDTLRVA QVFSDPPLNI 
VGAEKKSGTV HYAGGVTAPA TGVFEGLGDG VYRVGFRAHQ IAVARGDADR HGFQTTVAVT 
EITGSESFVH LRRGDDNWVA VLHGVHEFEP GQTLDAVLDP ANLFVFDAAD RLVAAPKPM