Gene Dret_2355 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_2355
Symbol
ID	8420215
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	+
Start bp	2686238
End bp	2687395
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	63%
IMG OID	645038957
Product	major facilitator superfamily MFS_1
Protein accession	YP_003199216
Protein GI	258406474
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	42
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGTGC TCCACGACCT CAACCTCTGC CTCCTGCTGC TCGTGGTCAT GTTCGCCGTA 
ACCGGCGGCA GCCTGGTCGG CCCGATTCTC CCGGAAATGA TCGCTCCGCT GGGCGCGACC 
CAGCAAACCG TTGGCCTGGC CCTGAGCGTC TACACCCTGG GAGCCCTCAT CACCACGCCG 
ATCTTTGGGG TCCTGGCCGA CCGCGTGGGC CGCAAACGGA TCATCGTCCC CACCACTCTG 
CTCTTTGGTA TCGCAGGGCT GCTGATCACC CTGACCGAAA GCTTCTGGCT CGTCCTTGTC 
TACCGGGCCC TGCAAGGCAT CGGTGTCGGC GGGATGATGA ACTCGGTCAT CGTGGCCATT 
GGCGACCGCT ATTCTGGCAT CGAGCGCCAA CAGGCCATGG GCTACCGCGT CACTGCCCAG 
GGACTCACCA ATGCGGCCGT TCCCTTTCTC TCAGGGGCAC TGGCGACCAT CGCCTGGTTT 
CTTCCCTTTT ATATCCATTC CCTGGCCATC GCAGTCGGGC TCCTGGCGGC CTGGAAACTC 
GAGGAACCGG TGCAGGCGCG CCCCTCGGCA AATTATCTCA CGCAGGCTCT GGCTGCGGTT 
CTCACCCTCC GGGCGTTCTG GCTCTTCTTT TCCAATTTCA TGGGCTTTTT TCTACTCTAC 
TGCCTGGTGG TCTACATGCC GCTTTTTGTG GTCAACGAAC TCGGCCACTC CACACTGCAC 
GCCGGTCTGG CCCTGTCTGT GGGCGCCGGT GTCAACTCCC TGGTCGCCAC CCAGGCTGGA 
CGCCTCCGCC GCCGCTTCAG TGAAGAGACG CTGGTCCTGA CCGGCTTTCT CTGCGCCGGG 
ATCGCGCTGC TGGCCTTGGG GCTGAGCCCG ACCTACGGAA CCATGCTCCT GTGCTTCGTG 
CTCTGGGGCC TCGGCTTTGG CGCACTCATG CCCACCCTGA ACGCGGCCGC GGCCGGCCTG 
GTCTCTGCAG AATTGCGCGG CGGGGTGCTC TCGCTGTTCA CCCTGCTGAT CTACCTGGGC 
CAGACCGTCT CCCCTCTCTT TTTCGCCTTG TTTCTCAAAA ACGGAACAGT GCACCACACC 
TTTTTTATCG CCAGTGGGCT GACACTTTTG CCGCTGTCCC TGACGCTTCT CGTCCGCAGC 
CGCCAAGACA CCACCTGA

Protein sequence

MRVLHDLNLC LLLLVVMFAV TGGSLVGPIL PEMIAPLGAT QQTVGLALSV YTLGALITTP 
IFGVLADRVG RKRIIVPTTL LFGIAGLLIT LTESFWLVLV YRALQGIGVG GMMNSVIVAI 
GDRYSGIERQ QAMGYRVTAQ GLTNAAVPFL SGALATIAWF LPFYIHSLAI AVGLLAAWKL 
EEPVQARPSA NYLTQALAAV LTLRAFWLFF SNFMGFFLLY CLVVYMPLFV VNELGHSTLH 
AGLALSVGAG VNSLVATQAG RLRRRFSEET LVLTGFLCAG IALLALGLSP TYGTMLLCFV 
LWGLGFGALM PTLNAAAAGL VSAELRGGVL SLFTLLIYLG QTVSPLFFAL FLKNGTVHHT 
FFIASGLTLL PLSLTLLVRS RQDTT