Gene Gobs_4036 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gobs_4036
Symbol
ID	8755724
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geodermatophilus obscurus DSM 43160
Kingdom	Bacteria
Replicon accession	NC_013757
Strand	-
Start bp	4233563
End bp	4235191
Gene Length	1629 bp
Protein Length	542 aa
Translation table	11
GC content	79%
IMG OID
Product	DAK2 domain fusion protein YloV
Protein accession	YP_003410972
Protein GI	284992418
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCTGCCGG CGCTCGACGA CGCCGCGGTC GGCCAGTGGT GCCGGGCCGC GGTCGCCGGG 
CTGTCCGCAG CGCGGGGCCG CCTCGACGAC CTCAACGTCT TCCCCGTGCC CGACGGCGAC 
ACCGGCACCA ACCTGCTGGC CACCGCCGAG GCCGCGCTGG CCACGCTCGA CGAGGCCGGC 
CCCGACCGGG CCGAGCCGGC CTGGGCGCTC GTGGCCCGCG GAGCCGTGCT GGGCGCCCGC 
GGCAACTCCG GCACCATCCT CGCCCAGCTG TGGCGCGGGC TGGCCGACCA GCTGGCGGGC 
CAGCCCCCGG CCGACGGGCC CACCCTCGCC GCCGCACTGC AGAAGGCCGC TGACAGCGCC 
TACGGCGCCG TCGCCGACCC GGAGGAGGGG ACGTTCCTCA CGGTGGCGCG GGCCGGCGGT 
GAGGCGGCGG TCGCCGCGGT CGCCGGCGGG CACACCGCCC TGGGCGAGGT CGTGCGGGCC 
GCGGCCGACG GCGCCCGTGC CGCCCTCGAG GCGACGCCGG GACAGCTGGC CGCGCTGCGC 
GACGCCGGCG TGGTCGACGC CGGGGGAGCG GGGCTGTGCC TGGTCCTCGA CGCCCTGGTC 
ACCACCGTGA CCGGTGTCGA GCCCGACCGC CCGCCGCTGG TCCGCCGGGC CGAGCGCGGC 
CTCCACGCCG GGCACCACCA CGGACACGAC TCCGGTGACC TGCCCCACCA GCCGCCCGCC 
GGCCCGGGCA GCGAGGTGCA GTACCTGCTC GCCGACAGCG ACGAGGCCGC CGTGGCCCAG 
CTGCAGGACC GGCTGGCCGC CCTGGGCGAC AGCCTGGTGG TCGTCGGCGT CGACACACCC 
GGCGGGCGCG AGTGGAACGT GCACGTGCAC GTCAGCGACG TCGGCGCGGC CATCGAGGCC 
GGCATCGAGG CCGGCCGGCC GTACCGCATC TCGGTGACCC CGCTGGCCCC GGTCCGGGCG 
CCGGCGCCGG ACCCCGGGGC GCGTGCGGTC GTCGCGATCG TCCCCGACGG CGGGCTCGCC 
GAGCTCTTCA CCGACGAGGG CGCCACCGTC GTCCCCTGCG GCCCGGGCGG CGTGGCCGAG 
GACGACGTGC TCGCCGCGGT CCTGGGGTCC GGCGCGGCGG GCGTCGTCGT GCTGCCCAAC 
GACCCGGCGT TCACCGCCCT GGCCTCCCGC GCCGCCGAGC GCGCCCGCGA GGAGGGGCGC 
GACGTCGCCG TCGTCCCCAC CCGCTCGCCG GTGCAGGGCC TCGCGGCGCT CGCCGTCGCC 
GACCCCTCCC GGCGCTTCGG TGACGACATC GTCACCATGG CCGAGGCGGC CGCGGCCACC 
CGCTGGGCCG AGGTCACCGT CGCCGAGCAC GAGGCGCTGA CCAGCGCCGG CCGGTGCGCG 
CCCGGCGACG TGCTGGGCTC GGCGGAGGGC GACGTCCTGC TCATCGGCGG GGAGCCGGCC 
GCGGTCGCCT GCGAGCTGCT CGACCGCATG CTGTCCGCCG GCGGGGAGCT GGTCACCGTC 
GTCGCCGGCT CCGACACCGA CCTCGCCGAC GTGGTCTGCA CGCACCTGGC GGCCGTGCAC 
CCGACCGTCG AGGTGACCCG CTACGACGGC GCACCCGAGG GGGTCCGGCT GCAGGTGGGG 
GTGGAGTAG

Protein sequence

MLPALDDAAV GQWCRAAVAG LSAARGRLDD LNVFPVPDGD TGTNLLATAE AALATLDEAG 
PDRAEPAWAL VARGAVLGAR GNSGTILAQL WRGLADQLAG QPPADGPTLA AALQKAADSA 
YGAVADPEEG TFLTVARAGG EAAVAAVAGG HTALGEVVRA AADGARAALE ATPGQLAALR 
DAGVVDAGGA GLCLVLDALV TTVTGVEPDR PPLVRRAERG LHAGHHHGHD SGDLPHQPPA 
GPGSEVQYLL ADSDEAAVAQ LQDRLAALGD SLVVVGVDTP GGREWNVHVH VSDVGAAIEA 
GIEAGRPYRI SVTPLAPVRA PAPDPGARAV VAIVPDGGLA ELFTDEGATV VPCGPGGVAE 
DDVLAAVLGS GAAGVVVLPN DPAFTALASR AAERAREEGR DVAVVPTRSP VQGLAALAVA 
DPSRRFGDDI VTMAEAAAAT RWAEVTVAEH EALTSAGRCA PGDVLGSAEG DVLLIGGEPA 
AVACELLDRM LSAGGELVTV VAGSDTDLAD VVCTHLAAVH PTVEVTRYDG APEGVRLQVG 
VE