Gene Rpal_3961 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_3961
Symbol
ID	6411642
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	4251267
End bp	4252331
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	64%
IMG OID	642713842
Product	ABC transporter related
Protein accession	YP_001992932
Protein GI	192292327
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.565548
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGTCGG TGCAGATTCA CGACGTGCGT AAGTCTTTCG GCGGCTTCGA AGTATTGCAC 
GGCGTGACTG TTCCCATCGA GGATGGTGAG TTCGTCGTTC TGGTCGGCCC GTCCGGCTGC 
GGCAAATCCA CTTTGCTGCG GATGCTCGCA GGGCTGGAGA AGATCACTGC CGGAACGATC 
TCGATCGGTG AGCGCGTCGT CAACGACGTG CAGCCGAAGG AGCGGGACAT CGCGATGGTG 
TTCCAGAACT ACGCGCTGTA TCCGCACATG ACCGTCGCCC AGAACATGGG CTTCTCGCTG 
AAGCTGCGCG GCGCCGACCA GAAGGCCATC GACAGCAAAG TGCAGCGGGC GGCCGACATC 
CTCGATCTCG GCAAGCTGCT CGACCGCTAT CCGCGCCAGC TCTCCGGCGG CCAGCGCCAG 
CGCGTTGCGA TGGGGCGGGC GATCGTGCGC GATCCGCAGG TGTTCCTGTT CGACGAGCCG 
CTGTCGAACC TCGACGCCAA GCTGCGGGTG GCGATGCGCA CAGAGATCAA GGAGCTGCAT 
CAGCGGCTGA AGACCACCAC GGTTTACGTC ACCCACGATC AGATCGAGGC GATGACGATG 
GCCGACAAGA TTGTGGTGAT GCAGGACGGT ATCGTCGAGC AGATCGGCGC GCCGCTCGAC 
CTGTACGACC GGCCCGACAA TAAGTTCGTG GCCGGCTTCA TCGGTTCGCC GGCGATGAAC 
TTCCTCGACG GCACGCTGAA AGTGAATGGC GGCCAGCCAT ATGTCGAGAC CGCCAGCGGC 
GCCAAGCTGC CGATCGCCGC GGCGCCTGCG AACGGCAATG GCCGCCCGGT GTCCTACGGC 
ATTCGTCCCG AGCATCTCGA CTTTGCAGAT AGTGGCATCC CGGCCGAGGT CGCGGTGGTC 
GAACCGACCG GCTCGGAAAC CCAGATCGTG GCCCGGGTCG GAAATCAGGA AGTGATCGCG 
GTTTTTCGCG AGCGGCATCC GGTCGGGCCC GGCGATCTGA TCCATCTGCA GCCGCGCGCC 
GACGTCGCGC ATCTGTTCGA CAAGGAGAGC GGCCGGCGGA TCTAG

Protein sequence

MASVQIHDVR KSFGGFEVLH GVTVPIEDGE FVVLVGPSGC GKSTLLRMLA GLEKITAGTI 
SIGERVVNDV QPKERDIAMV FQNYALYPHM TVAQNMGFSL KLRGADQKAI DSKVQRAADI 
LDLGKLLDRY PRQLSGGQRQ RVAMGRAIVR DPQVFLFDEP LSNLDAKLRV AMRTEIKELH 
QRLKTTTVYV THDQIEAMTM ADKIVVMQDG IVEQIGAPLD LYDRPDNKFV AGFIGSPAMN 
FLDGTLKVNG GQPYVETASG AKLPIAAAPA NGNGRPVSYG IRPEHLDFAD SGIPAEVAVV 
EPTGSETQIV ARVGNQEVIA VFRERHPVGP GDLIHLQPRA DVAHLFDKES GRRI