Gene RPB_2096 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_2096
Symbol
ID	3908510
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	2382584
End bp	2383648
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	66%
IMG OID	637883989
Product	ABC transporter related
Protein accession	YP_485713
Protein GI	86749217
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.00542123
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCGTCGG TGCAGATTCA CGACGTGCGG AAATCATTCG GCGGCTTCGA AGTCCTGCAT 
GGCGTGACGG TTCCGATCGA GGACGGCGCC TTCGTGGTGC TGGTCGGCCC TTCGGGCTGC 
GGCAAGTCGA CTTTGCTGCG AATGCTCGCG GGGCTGGAAA AAATCACTTC CGGGACGATC 
TCGATCGGCG ACCGCATCGT CAACGACGTG CAGCCGAAGG AACGCGACAT CGCGATGGTG 
TTCCAGAACT ACGCGCTGTA TCCGCACATG ACCGTCGCCC AGAACATGGG CTTCTCGCTC 
AAGCTGCGCG GTGCCGACCA GAAGGCGATC GACGACAAGG TCAATCGCGC CGCCGACATT 
CTCGATCTGC GCAAACTGCT CGACCGCTTC CCGCGGCAGC TCTCCGGCGG CCAGCGCCAG 
CGCGTCGCGA TGGGCCGGGC GATCGTGCGC GATCCGCAGG TGTTCCTGTT CGACGAGCCG 
CTGTCGAATC TCGACGCCAA GCTGCGCGTG GCGATGCGCA CCGAAATCAA GGAGCTGCAT 
CAGCGGCTGA AGACCACGAC GGTGTACGTC ACCCACGACC AGATCGAGGC GATGACCATG 
GCCGACAAGA TCGTGGTGAT GCAGGACGGC ATCGTCGAGC AGATCGGCGC ACCGCTCGAT 
CTCTACGACA ACCCCGCCAA CAAATTCGTC GCCGGCTTCA TCGGCTCGCC GGCGATGAAC 
TTTCTCGACG GCACGCTGAC GGTCGATGGC GGCCAGCCCT TCGTCGAGAC CGCGAACGGC 
GCGCGGCTGC CGATCACCGA GGCGCCGGCG GGCGGCAACG GGCGTCCGAT CACTTACGGC 
ATCCGCCCCG AGCATCTCGA CTTCGCCGAC ACCGGCATCG CGGCGGAGGT GGTGGTGGTC 
GAGCCGACCG GATCGGAAAC CCAGATCGTC GCCCGCGTCG GCGCGCAGGA GATCATCGCG 
GTGTTTCGCG AGCGGCACCG GGTGCAGCCC GGTGACGTCA TCCATCTGCA GCCGCGGCCG 
CAGGTCGCTC ATCTGTTCGA CAGGGAGACC GGCGCGCGGC TCTGA

Protein sequence

MASVQIHDVR KSFGGFEVLH GVTVPIEDGA FVVLVGPSGC GKSTLLRMLA GLEKITSGTI 
SIGDRIVNDV QPKERDIAMV FQNYALYPHM TVAQNMGFSL KLRGADQKAI DDKVNRAADI 
LDLRKLLDRF PRQLSGGQRQ RVAMGRAIVR DPQVFLFDEP LSNLDAKLRV AMRTEIKELH 
QRLKTTTVYV THDQIEAMTM ADKIVVMQDG IVEQIGAPLD LYDNPANKFV AGFIGSPAMN 
FLDGTLTVDG GQPFVETANG ARLPITEAPA GGNGRPITYG IRPEHLDFAD TGIAAEVVVV 
EPTGSETQIV ARVGAQEIIA VFRERHRVQP GDVIHLQPRP QVAHLFDRET GARL