Gene Gobs_1918 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gobs_1918
Symbol
ID	8753589
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geodermatophilus obscurus DSM 43160
Kingdom	Bacteria
Replicon accession	NC_013757
Strand	-
Start bp	1988194
End bp	1989399
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	71%
IMG OID
Product	homogentisate 12-dioxygenase
Protein accession	YP_003408992
Protein GI	284990438
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0204233
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGTTCT ACCGGCAGGT GGGCGAGGTC CCACCCAAGC GGCACACCCA GTTCCGTCGT 
CCCGACGGCG GCCTGTACTC CGAGGAGCTG GTCGGTGAGG AGGGCTTCTC CTCGGACTCC 
GCTCTGCTCT ACCACCGTGG CGTGCCGTCG GCGATCGTCG ACGCCCGGCC GTGGGAGCTG 
CCCGACCAGA GCCTGACGCC GAACGCGCCG CTGGTGCCCC GGCACCTGAA GCTGCACGAC 
CTGTTCCCCG GCGAGGAGCA CAAGGCCGTC GACGCGGTGA CCGGCCGCCG GCTGGTGCTC 
GGCAACGGCG ACGTGCGCAT CTCCTACGCG GTCTCGTCGT TGCCGAGCCC GTACTACCGC 
AACGCCACCG GCGACGAGTG CGTCTACGTC GAGCGCGGCA CCGCCACGGT GGAGACGACG 
TTCGGCGCGC TGACCGTCGG CCGGGGCGAC TACGTGGTCA TCCCGCGGAC CACCACGCAC 
CGCTGGATCC CGACCGGGTC CGAGCCGCTG CGCACCTACG CGATCGAGGC CAACAGCCAC 
ATCGCCCCGC CCAAGCGCTA CCTGTCGAGG TACGGGCAGT TCCTCGAGCA CGCGCCGTAC 
TGCGAGCGGG ATCTCCGTGC CCCCGCCGAG CCGCTGCTGG TCGAGGGCAC CGACGTCGAG 
GTCTACGTCA AGCACCGCGG CAACGGCCCC GGCGGGCTGG CCGGCACGGT GCACGTGCTC 
CCGGAGCACC CGTTCGACGT GGTCGGCTGG GACGGGCACC TCTACCCCTA CGCGTTCAAC 
ATCGCCGACT ACGAGCCGAT CACCGGCCGG GTGCACCAGC CCCCGCCGGT CCACCAGGTC 
TTCGAGGGTC ACAACTTCGT GATCTGCAAC TTCGTGCCGC GGAAGGTCGA CTACCACCCA 
CTGGCCGTCC CGGTGCCCTA TTACCACTCC AACGTCGATT CCGACGAGAT CATGTTCTAC 
GTCGACGGCG ACTACGAGGC CCGCAAGGGG TCGGGCATCG GCAAGGGCTC GATCTCGGTG 
CACCCCGGCG GGCACTCCCA CGGCCCGCAG CCCGGCGCGG TGGAGCGCTC CCTGGGCGTG 
GAGTACTTCG ACGAGCTCGC CGTCATGGTC GACACCTTCC GCCCGCTGGA CCTGGGCGAG 
GCCGGCGTCG CCGTCGACGA CGGGAAGTAC GCCTGGACCT GGTCCGGACG AGGCCCGTCG 
GCGTGA

Protein sequence

MAFYRQVGEV PPKRHTQFRR PDGGLYSEEL VGEEGFSSDS ALLYHRGVPS AIVDARPWEL 
PDQSLTPNAP LVPRHLKLHD LFPGEEHKAV DAVTGRRLVL GNGDVRISYA VSSLPSPYYR 
NATGDECVYV ERGTATVETT FGALTVGRGD YVVIPRTTTH RWIPTGSEPL RTYAIEANSH 
IAPPKRYLSR YGQFLEHAPY CERDLRAPAE PLLVEGTDVE VYVKHRGNGP GGLAGTVHVL 
PEHPFDVVGW DGHLYPYAFN IADYEPITGR VHQPPPVHQV FEGHNFVICN FVPRKVDYHP 
LAVPVPYYHS NVDSDEIMFY VDGDYEARKG SGIGKGSISV HPGGHSHGPQ PGAVERSLGV 
EYFDELAVMV DTFRPLDLGE AGVAVDDGKY AWTWSGRGPS A