Gene RPC_3647 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_3647
Symbol
ID	3972018
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	-
Start bp	4056490
End bp	4057557
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	65%
IMG OID	637926756
Product	ABC transporter related
Protein accession	YP_533501
Protein GI	90425131
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.265226
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGTCGG TGCAGATCCA CGACGTGCGG AAATCTTTCG GCGGCTTCGA AGTGTTGCAC 
GGCGTCAGCG TCCCGATCGA GGACGGCGCC TTTGTGGTGC TGGTCGGCCC CTCCGGCTGC 
GGCAAGTCCA CCTTACTACG GATGCTGGCG GGCCTGGAAA AGATCACCTC CGGCACCATC 
TCGATCGGCG ACCGCGTGGT CAACGACGTG CAACCGAAAG AGCGCGACAT CGCCATGGTG 
TTCCAGAACT ACGCGCTGTA TCCGCATATG ACGGTGGCGC AGAACATGGG GTTTTCGCTG 
AAGCTGCGCG GCACCGAGCA GGCGGTGATC GACGAGAAGG TCAACCGCGC CGCCGACATT 
CTCGATCTGC GCAAGCTGCT CGACCGCTAT CCGCGGCAAC TCTCCGGCGG CCAGCGCCAG 
CGCGTCGCAA TGGGCCGCGC CATCGTCCGC GATCCGCAGG TGTTTCTGTT CGACGAGCCG 
TTGTCGAACC TCGATGCCAA GCTGCGGGTG GCGATGCGTA CCGAAATCAA GGAACTGCAC 
CAGCGGCTGA AGACCACCAC GGTCTACGTC ACCCACGACC AGATCGAGGC GATGACCATG 
GCCGACAAGA TCGTGGTGAT GCAGGACGGC ATCGTCGAGC AGATGGGCTC GCCGCTCGAC 
CTCTACGACC GCCCCGACAA CAAATTCGTC GCCGGCTTCA TCGGCTCGCC GGCGATGAAT 
TTCCTCGCCG GCGAACTCAA GGTCAATGGC GGCCAGCCCT GGGTGGAGAC CGCGAGCGGC 
GCCAGGCTGC CGATCGAAGC GGCGCCGGCC TCGGCCAACG GCAAGGCGGT GACCTATGGT 
ATCAGGCCCG AGCATCTGGA ATTTTCCGAC GACGGCATCG AGGCCGAAGT GGTGGTGGTG 
GAGCCGACCG GATCGGAAAC CCAGATCGTG GCGCGGGTCG GCGCCCAGGA GCTGATCGCC 
ATTTTCCGCG ACCGCCGCAA CGTGCAGCCC GGCGACCGGA TTTATCTGAA GCCGCGCGCT 
AGCGCCGCCC ATCTGTTCGA CGACGCCACC GGCAAGCGAC TGTCCTGA

Protein sequence

MASVQIHDVR KSFGGFEVLH GVSVPIEDGA FVVLVGPSGC GKSTLLRMLA GLEKITSGTI 
SIGDRVVNDV QPKERDIAMV FQNYALYPHM TVAQNMGFSL KLRGTEQAVI DEKVNRAADI 
LDLRKLLDRY PRQLSGGQRQ RVAMGRAIVR DPQVFLFDEP LSNLDAKLRV AMRTEIKELH 
QRLKTTTVYV THDQIEAMTM ADKIVVMQDG IVEQMGSPLD LYDRPDNKFV AGFIGSPAMN 
FLAGELKVNG GQPWVETASG ARLPIEAAPA SANGKAVTYG IRPEHLEFSD DGIEAEVVVV 
EPTGSETQIV ARVGAQELIA IFRDRRNVQP GDRIYLKPRA SAAHLFDDAT GKRLS