Gene Gobs_4320 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gobs_4320
Symbol
ID	8756014
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geodermatophilus obscurus DSM 43160
Kingdom	Bacteria
Replicon accession	NC_013757
Strand	+
Start bp	4540481
End bp	4542400
Gene Length	1920 bp
Protein Length	639 aa
Translation table	11
GC content	72%
IMG OID
Product	glycosyltransferase
Protein accession	YP_003411253
Protein GI	284992699
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGACCA CTGCGGTGTC CCCCGACGTG GTGGCCGACC TGGCCGCCGA GGACCTGGCC 
CCCGGCCGGG CCGTGACCCT CCTCCAGCGG GTCCTCATGC CGCGCGGCGC CGACCCGCGC 
AAGGTCCGCG CCCTCTACCT CGACGAGGTC CGGTCCGAGA AGGTGCACGT CGCCTCCCGG 
TCGACCGGGC ACCTCTCGGC CGGTGACGAG GTCTCCTTCG CCACGTACTT CAACGCCTTC 
CCGGCGGGTT ACTGGCGGCG GTGGACCTCC CTGACCAGCG TGACGCTGCA GCTGCGCATC 
TCAGGCACCT GCCGCATCGA CGTGTACCGC TCCAAGGGCA ACGGCGACGT GCTGCACGCC 
CTGGGCACCA CCGTCGAGGG GCAGGGCCGG ACGGTCGAGC TCGACCTGGA CCTCACCCCC 
TTCGTCGAGG GCGGCTGGTA CTGGTTCGAC GTCACCGCCG ACGACGACAC GATCATCGAG 
GACGCCGGCT GGTACGCCGA CCGGGAGCCG CTGCGCCCGG GGCGGCTGGC CGTCGGCATC 
TGCACCTTCA ACCGTCCGGT CGACTGCGTC GCCGCGCTGC AGACGGTCGC CTCCGACCCG 
GTGCTCGACG CCGAGCTCGC CGCGGTGGTC GTCGCCGACC AGGGCAACCT CAAGGTGTGC 
GACGAGGCCT CGTTCCCCGA GGTGGCCGAC CAGCTCGGCG ACCGCCTGCA CCTGGTGGAG 
CAGGGCAACC TCGGCGGCAG CGGCGGCTTC GCCCGTGCCA TGCACGAGAC GCTGACGACC 
ACCGACGCCA CGCACCTGGT CTTCCTCGAC GACGACGTCC AGCTCGAGGC CGACAGCCTG 
CACCGGGCGC TGACCTTCGC CCGGTTCACC GACGAGCCCA CCCTCGTCGG TGGGCAGATG 
CTCACCCTGC AGGATCGCTC GGTGCTGCAC TCCATGGGCG AGAGCATCGA CCGCCGGCTC 
ATGAGGTGGC GTCCGGCCCC CTATGCCGCG GCGGGCCACG ACTTCGCGCA CTGGTCGCTG 
CGCGACGCCC GGCACCTGCA CCGTCGCGTG GACGTCGACT TCAACGGGTG GTGGATGTGC 
CTGATCCCCC GCGAGGTGGC CGAGCACATC GGGCTGCCGC TCCCGCTGTT CATCAAGTGG 
GACGACGCCG AGTACGGCCT GCGGGCCGGC GCTGCCGGAT ACCGCACGGT GACCCTCCCG 
GGCGCGGCGA TCTGGCACCT GTCCTGGACC GACAAGGACG ACGTCAGCGA CTGGCAAGCG 
TACTTCCACG CCCGCAACCA GCTCATCGTG GCCGCCCTGC ACAGCCCGCT GAAGCGGGCC 
GAGGACATCG TCCGCGAGAA CGTCCGGGCC GACATCCGGC ACCTGTTCCG GCTGGAGTAC 
TCCGCGGTCG CGCTGCACCT GAAGGCCTAC CGCGACTTCC TCGCCGGCCC GCAGGAACTC 
TTCCGGCAGC TGCCCGGCGT GCTGGCCGAG GTGCGTGCCG AGCGGGCGCG GTACTCCGAC 
GGTCAGGTCA TCACCGAGCG GGCCCGCATC CCGCTGCCGC AGATGGGCCA GGACGCGACC 
GAGGGCATGG TGCACCCGCC GGTGGCCAAG CGCGCGATCG CCCGCGCCGC GCTGCAGGCG 
CTGCGCAACA ACGTGCGGCC GGTCCAGGAC GCCGACGGCC GGCCCCAGGT GGAGCTGCCG 
GCCCGCGACG CCCAGTGGTT CGTGCTGGCG CAGCTGGACA GCGCCTCGGT CGCCACGGCC 
GACGGCCGGG GCGTCACGGT GCGCCGCCGC GACCCCGCGA CGTTCTGGCG GCTGGCCCGG 
GAGTCGGTGC GGCTCAACCT GGAGATCGCC CGGCGCTTCC CCCGCGCCAA GCAGCAGTAC 
CGCGACTCCT ACGGTGACCT GACCTCGGCG GAGAACTGGG TGAGCGTCTT CCAGGCGTGA

Protein sequence

MTTTAVSPDV VADLAAEDLA PGRAVTLLQR VLMPRGADPR KVRALYLDEV RSEKVHVASR 
STGHLSAGDE VSFATYFNAF PAGYWRRWTS LTSVTLQLRI SGTCRIDVYR SKGNGDVLHA 
LGTTVEGQGR TVELDLDLTP FVEGGWYWFD VTADDDTIIE DAGWYADREP LRPGRLAVGI 
CTFNRPVDCV AALQTVASDP VLDAELAAVV VADQGNLKVC DEASFPEVAD QLGDRLHLVE 
QGNLGGSGGF ARAMHETLTT TDATHLVFLD DDVQLEADSL HRALTFARFT DEPTLVGGQM 
LTLQDRSVLH SMGESIDRRL MRWRPAPYAA AGHDFAHWSL RDARHLHRRV DVDFNGWWMC 
LIPREVAEHI GLPLPLFIKW DDAEYGLRAG AAGYRTVTLP GAAIWHLSWT DKDDVSDWQA 
YFHARNQLIV AALHSPLKRA EDIVRENVRA DIRHLFRLEY SAVALHLKAY RDFLAGPQEL 
FRQLPGVLAE VRAERARYSD GQVITERARI PLPQMGQDAT EGMVHPPVAK RAIARAALQA 
LRNNVRPVQD ADGRPQVELP ARDAQWFVLA QLDSASVATA DGRGVTVRRR DPATFWRLAR 
ESVRLNLEIA RRFPRAKQQY RDSYGDLTSA ENWVSVFQA