Gene Rpal_0090 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_0090
Symbol
ID	6407733
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	100114
End bp	101802
Gene Length	1689 bp
Protein Length	562 aa
Translation table	11
GC content	69%
IMG OID	642709999
Product	protein of unknown function DUF894 DitE
Protein accession	YP_001989128
Protein GI	192288523
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.735299
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGGGCA CGGCGAAGCG CGGGCTGTTT TCCGGCGACG GGATCGCGGC GCCGCTGCGG 
CACGCACTAT TCCGGCGGAT CTGGCTGGCA AGCCTGCTGT CCAACCTCGG CCTGATGATC 
AACGGCGTCG GCGCCGCCTG GGCGATGACG CAGATGACCG CGTCCGCCGA CAAGGTGGCG 
CTGGTGCAGA CCGCCCTGAT GCTGCCGATC ATGCTGGTGG CGATGCCGGC GGGCGCGATC 
GCCGACATGT ACGACCGCCG CCTGGTGGCG CTGGCCGCGC TCGGCATCGG CCTCGCCGGC 
GCGACGACGC TGGCGGCGCT GGCGCATCTC GGGCTGGTGA CACCCAACAC CCTGCTGCTG 
TTCTGCTTCG TGATCGGCAC CGGCATGGCG CTGTTCGGAC CGTCCTGGCA GGCCTCGGTG 
TCCGAGCAAG TGCCGGCCGA AACCCTGCCG GCCGCAGTGG CGCTGAACGG CATCAGCTAC 
AACATCGCGC GCAGCTTCGG CCCGGCGGTC GGCGGCATCG TGGTGGCGGC TGCCGGCGCG 
GTGGCGGCGT TCGCCGCCAA TGCGGTGCTG TATCTGCCGC TATTGATCGT GCTGCTGCTG 
TGGCGGCGGG ACAGCGAGCC ACCGCGGCTA CCGCCAGAGC GGCTGAACCG CGCGATCGTC 
TCCGGCGTGC GCTATATCAC CAACTCGCCG GCAATCCGCA TTGTGCTAAC CCGCACGCTG 
GTGACCGGCA TCGCTGGCTC TTCGGTGCTG GCCCTGATGC CTCTGGTGGC ACGCGACCTG 
TTGCACAGCG GCGCCGAGAC CTACGGGCTG CTGCTCGGCG CATTCGGCAT CGGCGCGGTG 
ATCGGCGCAC TCAATGTCGG GATTGCGCGG CAGCGCTTGA GCAGTGAAGC CGCGGTTCGG 
CTGTGTGCGA TGATCATGGG CGTGGCAATG GCGGTGATCG CGATCAGCCG CTCGCCACTC 
CTCACCGCAG CAGCCCTCGT CGTCGCCGGC GCGGTGTGGA TGCTGGCGAT CGCGCTGTTC 
AACATCGGCG TGCAACTGTC GGCGCCGCGC TGGGTGGCGG GACGTTCGCT TGCGGCATTC 
CAGGCGTCGA TCTCCGGCGG CATCGCGATC GGCAGCTGGG GCTGGGGCCA CGTTGCTGAT 
CTGTCCGGCG TCGCGCCATC GATGCTGCTG TCGGGGCTGG CGATGCTGGC TTCTCCAGTG 
CTCGCCTTCC TGCTGCCGAT GCCGCCGGTC GGCACCCGCA CCGAGGACGC CGAACTGCTG 
GCCGATCCGG AATTGAAACT GGCGCTGACG TCGCGCAGCG GTCCGGTGGT GATCGAAATC 
GAGTACCGGA TCGACGCCGA CGAAGCGCGC GCGTTTCACA ACGTGATGCA GGAGGTGCAG 
CTCAGTCGCC AGCGCAACGG CGCCTATGGC TGGTCGATCG CCCGCGACGT CGCCGATCCC 
GAATTATGGA CCGAGCGCTA TCACTGCCCG ACCTGGCTCG ATTATCTGCG CCAGCGCAGC 
CGTTCGACCC AGGACGACCG CGCATTGCAC CGGCGCGCGA TCGCGTTTCA TCGTGGACCG 
GAGCCGGTGC GGGTGCGCCG CATGCTGGAG CGGCCGTTCG GCTCGGTGCG CTGGAAAGAG 
GAATCGCCCG ATCGCACTAC CGCGACCGAA GTGCTGCCGG TCGCCGGCGT CAGCGGCGGT 
TCGACATAG

Protein sequence

MAGTAKRGLF SGDGIAAPLR HALFRRIWLA SLLSNLGLMI NGVGAAWAMT QMTASADKVA 
LVQTALMLPI MLVAMPAGAI ADMYDRRLVA LAALGIGLAG ATTLAALAHL GLVTPNTLLL 
FCFVIGTGMA LFGPSWQASV SEQVPAETLP AAVALNGISY NIARSFGPAV GGIVVAAAGA 
VAAFAANAVL YLPLLIVLLL WRRDSEPPRL PPERLNRAIV SGVRYITNSP AIRIVLTRTL 
VTGIAGSSVL ALMPLVARDL LHSGAETYGL LLGAFGIGAV IGALNVGIAR QRLSSEAAVR 
LCAMIMGVAM AVIAISRSPL LTAAALVVAG AVWMLAIALF NIGVQLSAPR WVAGRSLAAF 
QASISGGIAI GSWGWGHVAD LSGVAPSMLL SGLAMLASPV LAFLLPMPPV GTRTEDAELL 
ADPELKLALT SRSGPVVIEI EYRIDADEAR AFHNVMQEVQ LSRQRNGAYG WSIARDVADP 
ELWTERYHCP TWLDYLRQRS RSTQDDRALH RRAIAFHRGP EPVRVRRMLE RPFGSVRWKE 
ESPDRTTATE VLPVAGVSGG ST