Gene Rsph17025_2969 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_2969
Symbol
ID	5085172
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009428
Strand	+
Start bp	3032536
End bp	3034221
Gene Length	1686 bp
Protein Length	561 aa
Translation table	11
GC content	71%
IMG OID	640484540
Product	protein of unknown function DUF894, DitE
Protein accession	YP_001169160
Protein GI	146279001
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.207712
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCCAGCCG CGCCCGCGCG CCCTACCCAT TGGGCTGCCG GCCCGACAGA AGGTTGTCCC 
TTGCCCGACC GTGTCTCACC CCTCGCGCCC TTCCGCCTTC CGACCTACCG CAACCTGTGG 
ATGGCGAGCA TCGTCTCGAA CTTCGGCGGG CTGGTGCAGG CCGTGGGCGC AGGCTGGATG 
ATGACGGAAC TCACCCATTC CGCGGGAATG GTGGCGCTGG TGCAGGCCTC GACCACGCTG 
CCGATCATGC TCTTCTCGCT GCCGTCGGGC GCCCTGGCCG ACAGCCTGAA CCGGCGGCGC 
CTCATGCTGA CGGCGCAGCT GTTCATGCTG GCCGTCTCGG CGGCGCTGGC ATTTGCGGCC 
TTTGCCGGGC TGCTCACGCC CTGGCTGCTG CTGACCTTCA CCTTCCTGAT CGGCGTGGGG 
GTGGCGCTGC ACAATCCCTC ATGGCAGGCC TCGGTCGGAG ATATCGTCCC GCGTGCGGAC 
CTGCCGTCGG CGGTCGCGCT CAACAGCATG GGCTTCAACC TGATGCGCAG CGTCGGGCCG 
GCGCTGGGCG GGCTGATCGT CGCCGCCGGC GGCGCGGCCG CAGCCTTTGC AATCAATGCG 
GCGAGCTACC TGCCGCTGGT CCTCGCGCTG TTCTTCTGGC GGCCGGACTA TGCGCCGCGC 
CGCCTTCCGC GCGAGGCGCT GGGATCGGCC GTCGCGGCGG GTCTGCGCTA TGTCTCGATG 
TCGCCGGTGC TGCTGAAGGT GCTGTTCCGG GGCTTTCTCT TCGGACTGGC CGCGGTCAGC 
CTGCTTGCGC TTCTGCCCAT CGTGGCCCGC GACCTGGTGG CCGGGGGCGC CTTCACCTAC 
GGGGCGCTGC TGGGCTGCTT CGGGGTGGGG GCGATCGGCG GGGCCTTTGC CGGTGCCCGC 
CTGCGCGAAC GGTTCCAGAA CGAGACCATC GTGCGCGCGG GCTTCCTGCT CTTTGCGGCG 
GCGCTGGTGG GGCTAGGCCT TTCGCGCGAC CTCTGGCTGT CGGGGCTGAT GCTGTTGCCG 
GCCGGTGCGG CCTGGGTGCT GGCGCTGTCG CTCTTCAATG TGAGCGTGCA GTTGGCCACT 
CCGCGGTGGG TCGTCGGGCG GGCCCTTGCG CTCTATCAGA CGGCGACCTT CGGCGGGATG 
GCAGCGGGCA GCTTCCTCTG GGGTCAGGCC GCCGAGGCGG GCGGCGTGGC CCAGGCGCTG 
TTCGGCGCCG CGGCCGTGCT GGTGGTGGGG GCGATCGTTG GCCTGCGGAT GCCGCTGCCC 
GCCTTCGGGA TGGAGGATCT CGATCCGCTC GGCCGCTTTG TCGAGCCGAA GCTGCCGGTC 
GATCTGAGGA CGCGGTCGGG GCCGATCATG GTGACGGTGG AATATGATGT CGCGCCGGAG 
AATGTGGAGC CGTTCCTCGC CGCGATGGCC GACCGGCGCC GGATCCGCAT CCGGGACGGG 
GCCCGGCAGT GGGTGCTGCT GCGGGATCTG GAACGGCCCG GGATCTGGGC CGAAAGCTAT 
CATGTGGCCA CCTGGGCCGA GTATCTGCGC CACCACGAGC GGCGGACGAA GGCGGATGCC 
GAGGTGACCG ACCGGCTGCT GGCGCTGCAT GAGGGGCCGG GCAAGCCGCG CGTCCGCCGG 
ATGATCGAGC GCCAGACAGT GCCGCTGCAC GACGATCTGC CGCTGAAGCC CGAGGAGCTG 
ACCTGA

Protein sequence

MPAAPARPTH WAAGPTEGCP LPDRVSPLAP FRLPTYRNLW MASIVSNFGG LVQAVGAGWM 
MTELTHSAGM VALVQASTTL PIMLFSLPSG ALADSLNRRR LMLTAQLFML AVSAALAFAA 
FAGLLTPWLL LTFTFLIGVG VALHNPSWQA SVGDIVPRAD LPSAVALNSM GFNLMRSVGP 
ALGGLIVAAG GAAAAFAINA ASYLPLVLAL FFWRPDYAPR RLPREALGSA VAAGLRYVSM 
SPVLLKVLFR GFLFGLAAVS LLALLPIVAR DLVAGGAFTY GALLGCFGVG AIGGAFAGAR 
LRERFQNETI VRAGFLLFAA ALVGLGLSRD LWLSGLMLLP AGAAWVLALS LFNVSVQLAT 
PRWVVGRALA LYQTATFGGM AAGSFLWGQA AEAGGVAQAL FGAAAVLVVG AIVGLRMPLP 
AFGMEDLDPL GRFVEPKLPV DLRTRSGPIM VTVEYDVAPE NVEPFLAAMA DRRRIRIRDG 
ARQWVLLRDL ERPGIWAESY HVATWAEYLR HHERRTKADA EVTDRLLALH EGPGKPRVRR 
MIERQTVPLH DDLPLKPEEL T