Gene Dret_0430 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_0430
Symbol
ID	8418235
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	-
Start bp	528748
End bp	529905
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	60%
IMG OID	645036991
Product	major facilitator superfamily MFS_1
Protein accession	YP_003197305
Protein GI	258404563
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.138711
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.304103
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGTTTC GCCGCTCCCC AATGTACCTC TTTTTGCTCG TCCTGACCGT GTCCGTGTGG 
GCTGGGTTTC AGGGCTGGCG GACGCTTTTG AACAATTTCG CCGTTGAGGT CGCCCACCTC 
GGCGGGCACC ACATGGGCGT CATCCAATCG GTCCGCGAGG TCCCGGGGTT TCTCGCTCTG 
CTGGTCATTT ATATCCTGCT GATCGTCAAA GAACACCGCT TGGCCGCGGT TTCCGTACTC 
ATCCTCGGCC TCGGCGTGGT CCTGACCGGA TTTTTTCCCT CGTTCTGGGG CGTTCTGCTG 
GCCACTTTGC TCATGTCCTT CGGCTTCCAC TATTTTGAAA CCGTCAACCA GTCCCTGACA 
CTGCAATACT TCTCCGTGGG CGACGCCCCG CTCGTTTTCG GTCGATTGCG CGCAATCGGC 
GCTGCGACCA GTATCGGCGT CGGCCTCTCC ATCTTCGCCC TGGCCAACTG GCTGCCCTAT 
AAGCTCCTTT TTGCCCTGCT GGGCTGCATC AGCATTGCCG GCGCCATGTG GTGCCTGTTC 
CAGGACCCCA CGGACACCAA TATGCCGTCG CAGAACAAGC ATATGGTCCT GCGGCGGCGG 
TACTGGCTCT TTTACACCCT GACCCTGCTC GCCGGGGCCC GGCGGCAGAT CTTCATCGCC 
TTCGCCGTAT TCTTGCTCGT GGAGAAATTC GGACTCAGCG TCCAGGAGAT CACCTTGTTG 
TTCGTGGCCA ACCAGGCCCT GAACTACTTT GTCAGCCCCC TGGTCGGACG GGCCATCAAC 
CATTTTGGCG AACGCTCGGT CTTGAGCGTG GAATACGCCT CGCTCATCGT CGTCTTCCTG 
GTTTACGCCC TCAGCGATTC CCAATGGCTG GTCCTGGCCA TGTATATCGT GGACCACGTG 
GTTTTCAATT GCGCCATGGC CATCCGGACC TTTTTCCAGA AAATCGGGGA TCCCGGTGAC 
ATCGCCCCGA GCATGGCCGT CGGCTTTACC ATCAACCATA TCGCGGCGGT GCTCATTCCG 
GCCGCAGCCG GCCTGATCTG GCTCGTCGAC CCCGCCTGGG TTTTTCTCGG TGGCGTGGGG 
TTGAGCCTGT GCTCGCTGCT CCTGGTCCAG GCCATCCCCT GGCAGCTCAA AAGAAGCCGC 
ACCGCTTCAT CCGGTTAG

Protein sequence

MSFRRSPMYL FLLVLTVSVW AGFQGWRTLL NNFAVEVAHL GGHHMGVIQS VREVPGFLAL 
LVIYILLIVK EHRLAAVSVL ILGLGVVLTG FFPSFWGVLL ATLLMSFGFH YFETVNQSLT 
LQYFSVGDAP LVFGRLRAIG AATSIGVGLS IFALANWLPY KLLFALLGCI SIAGAMWCLF 
QDPTDTNMPS QNKHMVLRRR YWLFYTLTLL AGARRQIFIA FAVFLLVEKF GLSVQEITLL 
FVANQALNYF VSPLVGRAIN HFGERSVLSV EYASLIVVFL VYALSDSQWL VLAMYIVDHV 
VFNCAMAIRT FFQKIGDPGD IAPSMAVGFT INHIAAVLIP AAAGLIWLVD PAWVFLGGVG 
LSLCSLLLVQ AIPWQLKRSR TASSG