Gene Dole_3001 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_3001
Symbol
ID	5695860
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	3602056
End bp	3603354
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	61%
IMG OID	641265617
Product	major facilitator transporter
Protein accession	YP_001530881
Protein GI	158523011
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATGCAT CCCTGGTTGC CAAAATGCTG CGGTACCGCT GGTGGATTTT CCTGATCCTG 
GGGGTGGCCT ACCTGCTGGT CTATTTCCAC CGCTTGTCTT TGTCCGTGGT GGCCGACGAC 
CTTATTTTCG AGTTTGCCAC ATCCGCCGGG GTGATGGGCC TGCTCTCCTC CATCTATTTT 
TACTGCTACG CGGTGATGCA GCTGCCGGCG GGCCTGCTGT CCGACTCCAT CGGGCCCAGG 
CGCACGGTCA GCGCCTTTCT GCTGGTGGCC GCGGCCGGCA GCATTATGTT CGGCATGGCC 
CCCACCATCG AGGTGGCCTT TTTTTCCCGG GTCCTGGTGG GGTTCGGCGT CTCCATGGTG 
TTTATTCCCA CCATGAAAAT CCTGGCCCAG TGGTTTCGAA AAGACGAGTT TGCCTCCATG 
GCCGGGCTGT TCAATGCCGT GGGCGGCATG GGGGTGCTGG CCGGCACCTG GCTGCTGGGA 
TACATGGCGC AGTCCATGGG CTGGCGAATC TCTTTTGTGC TGATCGGCGC GGGCACCCTG 
GTGATCGTGG TGCTGGCCTG GCTGGTGGTG CGCGACCGGC CCCAGGACAA GGGATGGCCC 
TCCATCGCGG ACATTGAAAA CCAACAGGCA ACCCCGCCCC CTGCCGCCAT TCCCCTGCTG 
GCGGGCCTGG GCCGGGTGCT GTCGGAAAAA TCCTTCTGGC CGGTGGCGGT GTGGTTCTTT 
TTTGACTGCG GCCTTTTTTT CGGGTTCGGC GGCCTGTGGG CAGGGCCCTA CCTGATGCAT 
GTCTACGGTC TGTCCAGGGC ACAGGCCGGC GGCGTGCTCT CCATGATCGC CTGGGGCATG 
ATCATCGGCA GCCCGCTGAT GGGGTTTTTC TCCGACCGGG TGGTCAAAAG CCGTAAAAAA 
CCCTTTATCA TCTGTGGCGT GGTGCTGTGC GCCGAGATGC TGTTTCTCTA CTTAAACCCC 
GACGGGCTTT CCCTGGCCGC GCTTTACGGG GTGTTCTTTG TCTTTTCCAT CTGCGCGTCA 
TCCATCGTAA TCGTTGGGTT TACCACCACC AAGGAGCTGT TTCCGGTCTC CATGGCGGGT 
ACCTCGGTGG GCGCGGTCAA CCTTTTTCCC TTTCTGGGCG GCGCAATCTA CATGCCGCTG 
CTGGGCCGGG TGCTGGACAG TGTGCCCCAG CCCACGCCCG GCTCATATGC CCTGGAGGGC 
TATACCCTTA TGCTGCTGGT GCTGCTGGCA TCCGCGGTGG CGGCCCTGTG CTGCACCTTT 
TTCATGAAGG AGACCTTCAC AAAGCAGGCC CACGGCTGA

Protein sequence

MNASLVAKML RYRWWIFLIL GVAYLLVYFH RLSLSVVADD LIFEFATSAG VMGLLSSIYF 
YCYAVMQLPA GLLSDSIGPR RTVSAFLLVA AAGSIMFGMA PTIEVAFFSR VLVGFGVSMV 
FIPTMKILAQ WFRKDEFASM AGLFNAVGGM GVLAGTWLLG YMAQSMGWRI SFVLIGAGTL 
VIVVLAWLVV RDRPQDKGWP SIADIENQQA TPPPAAIPLL AGLGRVLSEK SFWPVAVWFF 
FDCGLFFGFG GLWAGPYLMH VYGLSRAQAG GVLSMIAWGM IIGSPLMGFF SDRVVKSRKK 
PFIICGVVLC AEMLFLYLNP DGLSLAALYG VFFVFSICAS SIVIVGFTTT KELFPVSMAG 
TSVGAVNLFP FLGGAIYMPL LGRVLDSVPQ PTPGSYALEG YTLMLLVLLA SAVAALCCTF 
FMKETFTKQA HG