Gene Lcho_4302 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Lcho_4302
Symbol
ID	6162085
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Leptothrix cholodnii SP-6
Kingdom	Bacteria
Replicon accession	NC_010524
Strand	+
Start bp	4812429
End bp	4813760
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	71%
IMG OID	641667079
Product	homogentisate 1,2-dioxygenase
Protein accession	YP_001793318
Protein GI	171060969
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3508] Homogentisate 1,2-dioxygenase
TIGRFAM ID	[TIGR01015] homogentisate 1,2-dioxygenase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	50
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGACAC CCGTGAGCAC GTCCACCCTG ACCGCACTCG GCGGTTTCGG CAACGAATTC 
GCCACCGAGG CCATCGCCGG CGCGCTGCCG CAGGGCCGCA ACAGCCCGCA GCGCGCGCCG 
CTGGGCCTCT ATCCCGAGCT GGTCTCGGGC ACCGCCTTCA CGGCGCCGCG CGCGGCCAAC 
CGGCGGGTCT GGCTGTATCG CCGCCAGCCC TCGGTGGTGA CCGGCGGCTA CCAGCCCTAT 
GCGTCACCCC ATGGGCAGCC GCTGTGGACC AGCGGCGCCG CCGCTGGCGT GGTGACGCCG 
CCCGATCCGC TGCGCTGGCA TCCGTTCCCG CTGCCCGACG CGCCGACCGA TTTCGTCGAC 
GGCCTGCGCA CCGTGGTCGC CAACGGCGAC GTCGACGCCC AGGTCGGCAT GGGCGCGCTG 
ATCTACGCCG CCAACACCTC GATGACGCAG CGCGCGCTGG TCAACGCCGA CGGCGAGATG 
CTGCTGATCC CGCAGTTCGG CCGGCTCGTC ATCACCACCG AACAGGGCGT GCTGAACGTG 
GCGCCGGGCC AGATCGCGCT GCTGCCGCGC GGCCTGGCCT TCAAGGTGGC GCTGCCCGAC 
GGTGCCTCGC GCGGCTACGC CTGCGAGAAC TACGGCGCCC ATTTCCGGCT GCCCGAGCTG 
GGCCCGATCG GCTCCAACGG CCTGGCCAAC GCACGCGATT TCCACAGCCC GCAGGCGGCG 
TTCGAGGCCG AGAACCTGCC GCACCAGATC GTCAAGAAGT TCGGCGGCCG GCTCTGGCAG 
GCGCTGCAGC CGGCCACGCC GTTCAACGTG GTGGCCTGGC ACGGCAACCT GGCGCCGTGC 
GTGTACGACA CCGCGCACTT CATGACGATC GGCTCGATCA GCCACGACCA CCCCGATCCG 
AGCATCTTCA CCGTGCTGAC CAGCCCGAGC GACACGCCCG GCGTGGCCAA CTGCGACTTC 
GTGATCTTCC CGCCGCGCTG GCTGGTGGCC GAGGACACCT TCCGCCCGCC CTGGTACCAC 
CGCAACGTGA TGAGCGAGTT CATGGGCCTG GTCACCGGCG AATACGACGC CAAGCCCGAA 
GGCTTCAAGC CCGGCGGCGC CAGCCTGCAC AACGCGATGG TGCCGCACGG GCCCGACGCC 
GAGGCCTTCG AGCGCGCCAC GCAGGCCGAG CTGCAGCCGC AGAAACTCGA CAACACCCTG 
GCCTTCATGC TCGAGAGCCG CCTGCGCTTC GTGCCCACCG CCTGGGCGAT GCAGGGCAGC 
GGCACGCTCG AGGCCCGTTA CGCCGACTGC TGGCAAGGCC TGGCCGACCC GCTGCAAGGG 
CAACCCGCAT GA

Protein sequence

MSTPVSTSTL TALGGFGNEF ATEAIAGALP QGRNSPQRAP LGLYPELVSG TAFTAPRAAN 
RRVWLYRRQP SVVTGGYQPY ASPHGQPLWT SGAAAGVVTP PDPLRWHPFP LPDAPTDFVD 
GLRTVVANGD VDAQVGMGAL IYAANTSMTQ RALVNADGEM LLIPQFGRLV ITTEQGVLNV 
APGQIALLPR GLAFKVALPD GASRGYACEN YGAHFRLPEL GPIGSNGLAN ARDFHSPQAA 
FEAENLPHQI VKKFGGRLWQ ALQPATPFNV VAWHGNLAPC VYDTAHFMTI GSISHDHPDP 
SIFTVLTSPS DTPGVANCDF VIFPPRWLVA EDTFRPPWYH RNVMSEFMGL VTGEYDAKPE 
GFKPGGASLH NAMVPHGPDA EAFERATQAE LQPQKLDNTL AFMLESRLRF VPTAWAMQGS 
GTLEARYADC WQGLADPLQG QPA