Gene Dret_0033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_0033
Symbol
ID	8417835
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	-
Start bp	35457
End bp	36686
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	62%
IMG OID	645036596
Product	major facilitator superfamily MFS_1
Protein accession	YP_003196913
Protein GI	258404171
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0738] Fucose permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGTCCATTT CACCCAGCCC AGCGCAGCCG CAATTTACCC GCCTCGTCGG GCCGCTTGTG 
CTCATTTCGA CCATTTTTTT TCTCAATTTC ATTTCCCGGG TGGCCCTGGG TCCTGTACTT 
TTGCCCCTGC AAGAGGACCT CGGCATCAGC CTCAGCCGCA CCGGCCTCAT TTTTCTGACC 
TTGCAGGCCG GCTACAGCGT GGCCTTGCTC AATGCTGGGT GGGTATCCTC CCGATTGACG 
CACCGGCGGA CTATTTTGCT TTCGATTTGG GCCATCGGCG CGGGGTGGAT CTGTGTCGGT 
CTGAGCCCGA GTTTTCCGGT CATGCTCGCC TGCCTCTTTG CCACCGGTCT GGGCGGCGGC 
CTCTATCTCC CCTCCGGCGT GGCCTCGATC ACCGACATCA CCCCGAGCTG CCATTGGGGC 
AAAGGGTTCG CCATTCATGA AATGGCCCCG AGCCTGTCCT TCATCCTGGC CCCGCTGCTC 
GTCGAGGCCC TGCTCTTTCT GGGGTCCTGG CGCCTGGTGT ATATTGTCCT GGGCCTGTCC 
TGCTTCGTGG TCGGGGCCAT TTACCGCAAA CACAGCACCG CCGGGCGGTT TTCCGGACAG 
CCGCCGCGGC TCAAAGCCCT GCGGGCCATC CTGACCCGCC CCGCCTTCTG GGCCATGACC 
CTGTTTTTCG TCCTTGTCGT GGGCGGAGAG ATCGGGGTCT ACAACCTCGC CCCGGCCTAT 
TTGGTCAAAA GCCACGGCAT CCCGAGGGAA TGGGCCAATT TCATCCTTTC GGCCTCCCGG 
CTGCTCAGTC TGGGAACCGC TTTTGGGGCC GGTTGGTGTA TCGATAAGCT GGGCCTGAAA 
CGTTCCCTGA CCGTGATTCT CAGCGCCGGC GGCCTGGCAA CCATTGGCTT CGCCTGGGGC 
AGCAGTCTTT GGGTTGCGGC TATGCTCGTT CTCCAGCCGA TTTTTCTCGT CGCCTATTTC 
CCAGCCGGGT TTTCCGCCCT GACCAGCATC TCCGAAGACA AGCAAAACGA TCTGACCGTG 
TCCTTGACCG TGACCAGCGC CTCTTTGCTC GGCGCAGGCG GCATCCCAGC CCTGTTGGCC 
TACCTGGGCG AACACGTCTC TTTTAGTCTC GGCTTCACCG GCCTGGGGGT CTGCCTCGCG 
GCCAGTGCCC TGCTTGTCCC CTTTCTCGAT TTCCGCAATG CCGCGGCGGT GCAGGAAGGA 
CAGGAATGCC GTCACACGGA GGGGGGCTGA

Protein sequence

MSISPSPAQP QFTRLVGPLV LISTIFFLNF ISRVALGPVL LPLQEDLGIS LSRTGLIFLT 
LQAGYSVALL NAGWVSSRLT HRRTILLSIW AIGAGWICVG LSPSFPVMLA CLFATGLGGG 
LYLPSGVASI TDITPSCHWG KGFAIHEMAP SLSFILAPLL VEALLFLGSW RLVYIVLGLS 
CFVVGAIYRK HSTAGRFSGQ PPRLKALRAI LTRPAFWAMT LFFVLVVGGE IGVYNLAPAY 
LVKSHGIPRE WANFILSASR LLSLGTAFGA GWCIDKLGLK RSLTVILSAG GLATIGFAWG 
SSLWVAAMLV LQPIFLVAYF PAGFSALTSI SEDKQNDLTV SLTVTSASLL GAGGIPALLA 
YLGEHVSFSL GFTGLGVCLA ASALLVPFLD FRNAAAVQEG QECRHTEGG