Gene Gobs_3003 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gobs_3003
Symbol
ID	8754676
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geodermatophilus obscurus DSM 43160
Kingdom	Bacteria
Replicon accession	NC_013757
Strand	-
Start bp	3140408
End bp	3141535
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	81%
IMG OID
Product	glycosyl transferase group 1
Protein accession	YP_003409984
Protein GI	284991430
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.394056
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCTGAGC GGCTCCCGCT GCAGGGCCGC CGGGTGGCCG AGGTCCTGGC CACCAGCACC 
GGTGGGGTGG GCACGCACGT GCGGGCGGTG CTGCCCGTCC TGGTCGCGGC CGGCGCCGAC 
GTCCGGGTGT GCGGACCTGC GGCCACCGAG CAGCTGTTCG GCTTCACCGC GGCGGGTGCC 
GCCTTCGCGC CCGTCGGGAT CTCGGCCGGC CTCTCGCCCG GCGCCGACGC CCGCGCCGTC 
GCCGCGCTGC GCCGCGCCAC CGCCGACGCG GACCTGGTGC ACGCCCACGG CCTGCGCGCC 
GGCCTGGTCG CCGCGGCGGC CCGCCGGCTC GGCGACCGCA GCCGGCCCCT GGTGCTCACG 
CTGCACAACG CCCTGCCCGA GGGCGGAGGC GCGCTGCGCC GGGTGCTGCG GCTGGCCGAG 
CGGGCCACGA TCAGCGGCGC CGACGTCGTC CTCGCCGCCT CCGGTGACCT CGCCGAGAAC 
GCCTGGCGGC AGGGTGCGCG GGACGTGCGG GTCGCCCCCG TCTCCGCGCC GCCGCTGCCC 
GCCGCGGCCC GGACCGCCGC CGAGGTGCGC GCCGAGCTCG GCCTGGCCGA CGGCCGGCCG 
CTGGTCCTCG CCGTCGGGCG GCTGCACCCG CAGAAGGGCT ATGACGTCCT GCTCGACGCC 
GCCGCCCGGT GGGCCGGCAG CTCGCCGCCA CCGCTGGTGG CGGTCGCCGG CGACGGCCCG 
CTGCAGGACG AGCTCGCCGC CCGGATCGCC GCCGAGCGGC TGCCCGTGGT GCTGCTCGGC 
CGGCGCAGCG ACGTCGCCGA CCTGCTGGCC GCCGCCGACC TCGCCGTGCT GCCCTCGCGC 
TGGGAGGCCC GCTCGCTGAC CGCACAGGAG GCGCTTCGCG CCGGCACCCC GCTGGTCGCC 
ACCCGCACCG GCGGGCTGCC CGAGCTGCTC GGGGACGGCG CGCAGCTGGT GCCCGTGGGC 
GACCCCGTCG CGCTGGCCGA CTCGGTCACC GGGTTGCTGG CCGACCCCGC GCGCGCCCGG 
CGGCTGGCCG AGGCCGGCAG CCGGCAGGCG GCGACCTGGC CGGACGAGGC CGCCACCGCC 
CGCCAGCTGG TCGCCCTCTA CCGCGAACTG CTCGGCGCAC CCCGATGA

Protein sequence

MAERLPLQGR RVAEVLATST GGVGTHVRAV LPVLVAAGAD VRVCGPAATE QLFGFTAAGA 
AFAPVGISAG LSPGADARAV AALRRATADA DLVHAHGLRA GLVAAAARRL GDRSRPLVLT 
LHNALPEGGG ALRRVLRLAE RATISGADVV LAASGDLAEN AWRQGARDVR VAPVSAPPLP 
AAARTAAEVR AELGLADGRP LVLAVGRLHP QKGYDVLLDA AARWAGSSPP PLVAVAGDGP 
LQDELAARIA AERLPVVLLG RRSDVADLLA AADLAVLPSR WEARSLTAQE ALRAGTPLVA 
TRTGGLPELL GDGAQLVPVG DPVALADSVT GLLADPARAR RLAEAGSRQA ATWPDEAATA 
RQLVALYREL LGAPR