Gene RPD_3622 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3622
Symbol
ID	4024136
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	4037649
End bp	4038884
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	66%
IMG OID	637963826
Product	major facilitator transporter
Protein accession	YP_570746
Protein GI	91978087
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.769068
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.781308
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGGCAG CTCAGCTCAG CCCGTTTCAG CGCTGGTCGA TCCTGATCGG CGCCTCGGTG 
CTGCTCAGCC TCGCGATGGG GATGCGGCAG AGCTTCGGAC TGTTTCAACC TTCCGTGATC 
CGCGACGTCG GCATCACCAG CGCCGATTTC TCGCTGGCGA CGGCTCTGCA GAATATCATC 
TGGGGCGTGA CGCAGCCGAT GGTCGGGCTG ATCGCCGACC GCTACGGCTC GCGCTGGGTG 
ATGCTCGGCG GCGTGCTGAT CTATGCCGCC GGCCTGGTGC TGATGATGAT CGCCGAATCG 
GCGTTGGTAT TTACGCTCGG CTGCGGCGTC TGCGTCGGCA TCGCGTTGTC CTGCACCGCC 
TCCAGCATGA CGATGACGGC GACCTCGCGC ACCGTGTCGG CCGCCAAGCG CAGCGTGGCG 
ATGGGCGCGG TCTCGGCCGC GGGATCGCTC GGCCTGGTGC TGGCCTCGCC GCTTGCGCAA 
ACCTTGATCA CAACCTCGGG CTGGCAGATG GCGCTGATCG GCTTCCTCGG CCTTGCCGCG 
GTGATGCTGC CATCCGCCTT TTTCGCGGGG CGGTCCGACG ACATCGAGAT CGACAAGGCC 
GACGATCTGG ATCAGTCGGC GGGTCAGGTG GTGCAGACCG CGCTCGGCCA TTCCGGTTTC 
ATGGTGATGG CGATCGCGTT CTTCGTGTGC GGGCTGCAGC TCGTCTTCAT CACCACGCAT 
CTGCCGAACT ATCTCGCGAT CTGCGGTCTT GACCCCTCGC TCGGCGCCAC CGCGCTGGCG 
GTGATCGGGC TGTTCAACGT GATCGGCTCC TACGCCTGCG GCTGGCTCGG CGGTCGCTAT 
CCGAAGCAAT ACCTGCTCGG CGGCATCTAT ATCGTGCGCT CGCTGACGAT CGCGGCGTAT 
TTCTACTTCC CGGCCTCGGC GACCACGACA CTGGTGTTCG CCGCGGTGAT GGGCGCGCTA 
TGGCTCGGCG TGATCCCGCT GGTCAACGGC CTGGTCGCGC AACTGTTCGG GCTGCGCTAC 
ATGGCGACGC TGACCGGCAT CGCTTTCTTC AGCCATCAGG TCGGTTCGTT CCTGGGGGCG 
TGGGGCGGCG GTATGGTCTA CGATCACCTC GGCAATTACG ATCGCGCCTG GCAGGCCGCG 
GTGTTGATCG GGCTGATCGC CGGCACCGCG CAGATGATGA TGAATGTCCG TCCGCCGCGG 
CGGCGTGAGG AATTGGCGGT GCCTGCCACC GCCTGA

Protein sequence

MKAAQLSPFQ RWSILIGASV LLSLAMGMRQ SFGLFQPSVI RDVGITSADF SLATALQNII 
WGVTQPMVGL IADRYGSRWV MLGGVLIYAA GLVLMMIAES ALVFTLGCGV CVGIALSCTA 
SSMTMTATSR TVSAAKRSVA MGAVSAAGSL GLVLASPLAQ TLITTSGWQM ALIGFLGLAA 
VMLPSAFFAG RSDDIEIDKA DDLDQSAGQV VQTALGHSGF MVMAIAFFVC GLQLVFITTH 
LPNYLAICGL DPSLGATALA VIGLFNVIGS YACGWLGGRY PKQYLLGGIY IVRSLTIAAY 
FYFPASATTT LVFAAVMGAL WLGVIPLVNG LVAQLFGLRY MATLTGIAFF SHQVGSFLGA 
WGGGMVYDHL GNYDRAWQAA VLIGLIAGTA QMMMNVRPPR RREELAVPAT A