Gene Tbis_1107 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tbis_1107
Symbol
ID	9167597
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermobispora bispora DSM 43833
Kingdom	Bacteria
Replicon accession	NC_014165
Strand	+
Start bp	1256122
End bp	1257321
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	70%
IMG OID
Product	homogentisate 12-dioxygenase
Protein accession	YP_003651722
Protein GI	296269090
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	0.141602
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGTACT ACCGCCGGGT GGGCGACGTC CCGCCGAAGC GCCACACGCA GCACCGGGAT 
GAGACCGGGC GGCTCTACTA CGAGGAGCTC ATGGGCGAGG AGGGCTTCTC CTCCGACTCC 
TCGCTCCTCT ACCACCGGCA CCTGCCCTCG GCGATCGTCG GCTTCGAGCC GTGGGAGCCG 
CCGGACCACA CCACCACGCC GAACCACCCG CTGCGCCCCC GGCACCTGCG GCTCCACGCC 
CTCTTCCCGG GCGACTCCTG GCGGGACGCC GACGTGGTGA CCGGGCGCCG GATGATCCTC 
GGCAACGCGG ACGTGCGCAT CTTCTACGTG GCGGCGGGCA AGGAGTCACC GCTGTACCGC 
AACGCGACCG GCGACGAGCT CGTCTACATC GAGTCCGGTG AGGCCGTCGT CGAGACCGTG 
TTCGGCCCGC TCCGCGCCAA GACCGGCGAC TACGTGGTCA TGCCGGCCTC CACCATCCAC 
CGCTGGCTGC CCCAGGGCGG CGAGCCGCTC CGCGCCTACA TCATCGAGGC CTCCGGCCAC 
GTCGCGCCGC CGAAGCGCTA CCTTTCCCGG TACGGCCAGT TCCTCGAGCA CGCGCCGTAC 
TGCGAGCGGG ACCTGCACGG GCCCGAGGAG GTGCTCTGCG TCGACGGCAC CGACGTCGAG 
GTCCTGGTCA AGCACCGCGG CCCGGGCGGC ATCGCCGGCA CCAGGTTCGT CTTCGAGCGC 
CACCCGTTCG ACGTCGTCGG CTGGGACGGC TGCCTGTACC CCTACACCTT CAGCATCTTC 
GACTTCGAGC CGATCACCGG GCGCGTCCAC CAGCCGCCGC CGGTGCACCA GGTCTTCGAG 
GGGCACAACT TCGTCGTGTG CAACTTCGTG CCCCGCAAGG TCGACTACCA CCCGCAGGCC 
ATCCCGGTGC CGTACTACCA CTCGAACGTC GACTCCGACG AGGTGATGTT CTACTGCGGC 
GGGAACTACG AGGCGCGGAA GGGCTCCGGG ATCGGCCAGG GCTCGGTCTC GCTCCACCCC 
GCCGGCCACA CCCACGGCCC GCAGCCCGGC GGGTACGAGC GGAGCATCGG CGTGGAGTTC 
TTCGAGGAGT ACGCCGTCAT GGTCGACACC TTCCGCCCGC TCGAGCTCGG CGAGGCCGCG 
CTCGCCTGCG ACGTCGACGG CTACCAGTTC AGCTGGGCCG CGCAGAGGCA GGGGAAGTGA

Protein sequence

MAYYRRVGDV PPKRHTQHRD ETGRLYYEEL MGEEGFSSDS SLLYHRHLPS AIVGFEPWEP 
PDHTTTPNHP LRPRHLRLHA LFPGDSWRDA DVVTGRRMIL GNADVRIFYV AAGKESPLYR 
NATGDELVYI ESGEAVVETV FGPLRAKTGD YVVMPASTIH RWLPQGGEPL RAYIIEASGH 
VAPPKRYLSR YGQFLEHAPY CERDLHGPEE VLCVDGTDVE VLVKHRGPGG IAGTRFVFER 
HPFDVVGWDG CLYPYTFSIF DFEPITGRVH QPPPVHQVFE GHNFVVCNFV PRKVDYHPQA 
IPVPYYHSNV DSDEVMFYCG GNYEARKGSG IGQGSVSLHP AGHTHGPQPG GYERSIGVEF 
FEEYAVMVDT FRPLELGEAA LACDVDGYQF SWAAQRQGK