Gene Rpal_4894 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_4894
Symbol
ID	6412580
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	5261255
End bp	5262334
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	67%
IMG OID	642714771
Product	ABC transporter related
Protein accession	YP_001993858
Protein GI	192293253
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.332035
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGTCA GCCTGGAGAA TGTCACCAGG GTGCTGGACG GCGTTCCGGC GATCCGCAAC 
GTATCGCTGA CGCTGGAACG CGGTACGCTC AGCGTGCTGC TCGGACCAAC CCTGTCGGGC 
AAGACCTCGA TCATGCGGCT GCTCGCCGGC CTCGACAAGC CGACCACCGG TCGTGTGCTG 
GTCGACGGCA AGGACGTCAC CGGCGCCGAT GTACGCACCC GCTCGGTGGC GATGGTGTAT 
CAGCAGTTCA TCAACTACCC GTCGCTGACC GTGTACGAGA ACATCGCCTC GCCGCTGCGC 
GTGCAGCGCA AGTCGCGCGC CGAGATCGAG CAGCGCGTCC AGGAGGCAGC CAAGCTGCTC 
AAGCTCGAGC CGTATCTGCA GCGCACGCCG CTGCAGCTTT CCGGCGGCCA GCAGCAGCGC 
ACCGCGATCG CCCGCGCGCT GGTCAAGGGT GCCGATCTGG TGTTGCTCGA CGAGCCGCTC 
GCCAACCTCG ACTACAAACT GCGCGAGGAA CTGCGCACCG AGCTGCCGAA GATCTTCGAG 
GCCTCCGGCG CGATCTTCGT TTACGCCACC ACCGAGCCTT CCGAAGCGCT GCTGCTCGGC 
GGCCGCACCA TCTGCATGTG GGAAGGTCAG GCGCTACAGG TCGGGCCGAC CCCGCAGGTG 
TATCGCAAGC CCGACACCAT GCGGGTGGCG CAGGTGTTCT CCGATCCGCC GCTCAACATC 
GTCGGCGCCG AGAAGAAGGC CGGCACCGTG CATTACTCCG GCGGCGTCAC CGCGCCCGCG 
ACTGGTGTAT TCGCGAGCCT TTCCGATGGC GCCTATCGCG TCGGCTTCCG TGCGCATCAG 
ATCGAGGTGA AGAGCGCCGA TCCGGATCGC CACGCGTTCC GAGCCACCGT CGCGGTGACC 
GAGATCACCG GCTCTGAGAG CTTCGTGCAT CTGAAGCGCG GCGACGATTA CTGGGTCGCG 
GTGCTGCACG GCATCCACGA GTTCGAGCCG GGCCAGACGC TCGACGCCAT CCTCGACCCC 
GCCAATCTGT TCGTGTTCGA CGCGGCTGAT CGCCTCGTCG CCGCGCCGAA GCCGATCTGA

Protein sequence

MSVSLENVTR VLDGVPAIRN VSLTLERGTL SVLLGPTLSG KTSIMRLLAG LDKPTTGRVL 
VDGKDVTGAD VRTRSVAMVY QQFINYPSLT VYENIASPLR VQRKSRAEIE QRVQEAAKLL 
KLEPYLQRTP LQLSGGQQQR TAIARALVKG ADLVLLDEPL ANLDYKLREE LRTELPKIFE 
ASGAIFVYAT TEPSEALLLG GRTICMWEGQ ALQVGPTPQV YRKPDTMRVA QVFSDPPLNI 
VGAEKKAGTV HYSGGVTAPA TGVFASLSDG AYRVGFRAHQ IEVKSADPDR HAFRATVAVT 
EITGSESFVH LKRGDDYWVA VLHGIHEFEP GQTLDAILDP ANLFVFDAAD RLVAAPKPI