Gene Gobs_3044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gobs_3044
Symbol
ID	8754720
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geodermatophilus obscurus DSM 43160
Kingdom	Bacteria
Replicon accession	NC_013757
Strand	-
Start bp	3190704
End bp	3192089
Gene Length	1386 bp
Protein Length	461 aa
Translation table	11
GC content	72%
IMG OID
Product	major facilitator superfamily MFS_1
Protein accession	YP_003410025
Protein GI	284991471
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0440547
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCGCCC TCACCCCCAC CACCCGACAG CCGACCGCGC CGGTCACCGC CGCGCCGCGC 
CGCGGTCGCT GGATCGACGA CTGGCGCCCG GAGGACCCCG CCTTCTGGGA GTCCGCGGGC 
AAGCCGGTCG CCCGCCGCAA CCTGTTCTTC TCGGTCTTCT CCGAGCACAT CGGCTTCTCG 
ATCTGGAGCC TGTGGTCGGT GCTCGTGCTG TTCCTGCCCG AGGCCGTGTA CGGCATCGAC 
CCGGCCGGGA AGTTCCTGCT GACCACGCTG CCGACGGCGC TGGGCGCATT CGTCCGGCTG 
CCCTACACCT TCGCCGTCGC GAGGTTCGGC GGCCGCAACT GGACGATCGT CAGCGCCGCG 
CTGCTGCTGG TGCCCACGAT CGCCACGGCC GTCGTCCTGG AGCCCGGCGT CGACTACACG 
ACCCTGCTCG TCGTCAGCTG CCTCGCCGGT GTCGGTGGCG GCAACTTCGC CAGCTCCATG 
GCCAACATCA ACGCCTTCTA CCCGAACCGG CTCAAGGGCT GGGCGCTCGG CCTCAACGCC 
GGCGGCGGCA ACCTCGGCGT CCCCGTCGTC CAGCTGGTGG GCCTGCTCGT GCTGGCCACC 
GCGGGCGCCG AGCACCCGCG GCTGGTCCTG CTGGTCTACA TCCCGCTGAT CGCCGTCGCC 
GCCGTCGGTG CGGCCCTGCT CATGGACAAC CTGACGACGG CGCGCAACCA GCCGCGGGCC 
ATGCGCGAGG CCACCCGCGA GCCGCACACC TGGATCATGT CCTTCCTCTA CATCGGCACC 
TTTGGCTCGT TCATCGGCTT CGGGTTCGCC TTCGGCCAGG TGCTGCAGAA CCAGTTCACC 
GGCGACTTCG CCACGCCCCT CGCCGCCGCG TCGCTGACCT GGCTCGGCCC GCTGCTGGGC 
TCGCTGATCC GCCCGCTCGG CGGCTCGCTG GCCGACCGCT TCGGCGGTGC CCGCATCACG 
TTCTGGAACT TCGCGGCGAT GGCCGTCGGC GCCGGGATCG TGTGGAGCGC CAGCCAGGTG 
GGGTCGCTGC CGCTGTTCGT CGTCGGCTTC GTGTCGCTGT TCGTGTTCAG CGGTCTCGGC 
AACGGCTCGA CCTACAAGAT GATCCCGGCG ATCTTCCGCA CCCAGGCGCA GCAGCGGGTG 
GCCGCCGGGG AGGACGGCGC CGTCGCCGAC CGGCACGCGC TGCGCATGTC CGGCGCGCTC 
ATCGGCATCG CCGGCGCGGT CGGCGCCTTC GGCGGCGTGC TGGTCAACCT GGCCTTCCGC 
CAGTCGTTCC TGGCCACCGG CACCGGCGAC TCGGCCTATC TGGTGTTCAT CGCCTTCTAC 
CTGGTCTGCC TCGCCGTCAC GTGGGCGGTC TACCTGCGGC CCCGGGCGCC CATGTCCGGG 
GTGTGA

Protein sequence

MAALTPTTRQ PTAPVTAAPR RGRWIDDWRP EDPAFWESAG KPVARRNLFF SVFSEHIGFS 
IWSLWSVLVL FLPEAVYGID PAGKFLLTTL PTALGAFVRL PYTFAVARFG GRNWTIVSAA 
LLLVPTIATA VVLEPGVDYT TLLVVSCLAG VGGGNFASSM ANINAFYPNR LKGWALGLNA 
GGGNLGVPVV QLVGLLVLAT AGAEHPRLVL LVYIPLIAVA AVGAALLMDN LTTARNQPRA 
MREATREPHT WIMSFLYIGT FGSFIGFGFA FGQVLQNQFT GDFATPLAAA SLTWLGPLLG 
SLIRPLGGSL ADRFGGARIT FWNFAAMAVG AGIVWSASQV GSLPLFVVGF VSLFVFSGLG 
NGSTYKMIPA IFRTQAQQRV AAGEDGAVAD RHALRMSGAL IGIAGAVGAF GGVLVNLAFR 
QSFLATGTGD SAYLVFIAFY LVCLAVTWAV YLRPRAPMSG V