Gene Hoch_0253 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_0253
Symbol
ID	8542632
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	375938
End bp	377593
Gene Length	1656 bp
Protein Length	551 aa
Translation table	11
GC content	74%
IMG OID	646385049
Product	3-dehydroquinate synthase
Protein accession	YP_003264787
Protein GI	262193578
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0337] 3-dehydroquinate synthetase
TIGRFAM ID	[TIGR01357] 3-dehydroquinate synthase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCCGCC ACGTCTTCCT GACCGGCTTC ATGGCCACCG GCAAGAGCAC GGTTGGCCGC 
CAGCTCGCCG CCCGCCTGCG GCGGCCCTTT CTCGATCTCG ACGACGCGGT CGAAGCCGAG 
GCCGGCCACA CCGTGGCCGA TATCTTCGCC AGCGAGGGCG AGATCGGCTT TCGTCGCCGC 
GAGCGCGCCG CCCTGCAGCG CATCGCCGAC GGACCCGCGG CCGTCATCGC CACCGGCGGG 
GGCGCTGCCT GTCACGGCGA CAACCTGGCG CAGATGCGCC GCAGCGGCTT GACCATCGCG 
CTCACGGCGC CGCTGGCGAC CGCCCGCGCG CGCGCCGACG CCGGCGAGCG CGAGCGGCCG 
CTCCTGCGCG CCACCGAGGC CGAGCTCGAG GCCCTGTACC GCTCCCGCGA GCCGATGTAC 
CGCCAGGCCC ACGCCTGCGT GCGCACCGAG GACAGCGAGC CCGCGCTGTT GGCCCGCGAG 
ATCGCGGCCC TGGTAGCGCG CGCCGAAACC CTGCCCGACG ACGCCCAGGA GCAGGCGAGC 
TGGGTGGCGC TGCGCGAGGG CGCGTATCCC GTGGTCGTCG CCGAGGGCGG CAGCGATCGC 
GTGGGCACCT GGCTGCGCAG CGTGCTCGGC GAGCGGCGAC CGAGCCGAGT TGCCGTGGTC 
TCGGACGACA ACGTGGCCCC GCTGCACGGC GAGCGCGTGC GCCGGGCGAT CGACGGCGCC 
GACCTGTGCG AGAGGCCGTG CTCGCTGCAC ACCGTGGCAG CCGGCGAGCG CTCCAAGCGC 
TTCGAGGTAT TGGGCCGACT GGTCGACGAG CTGGTCGCCG AGGGCCTCGA CCGCAGCTCG 
CTGGTGGTCG CCCTGGGCGG CGGCGTGGTC GGCGATCTGG CCGGCTTCAC GGCCGCGTGT 
CTGTATCGCG GCGTGCCCGT GGTGCAGGTG CCGAGTACGC TGCTGGCCAT GACCGACGCC 
GCCATCGGCG GCAAGACCGG CATCGACATC GCGGCCGGCA AGAATCTGGT CGGCGCCTTC 
TGGCAGCCGC GCATGGTGGT CGTCGATCCC GCGCTGCTGG CGACCCTGCC CGCGCGCGAG 
CTGCGCGCCG CCTTCGGCGA GCTGATCAAG TACGGCCTGC TCGACGGCGA GGAGCTGTAC 
GCGCGCATCG AGGCGCTCGC CGACGCGCTG GCGGCCGCCG GGGACGAGCC CGGCGCGGCG 
CTGTCGCCCG CGTTCACCGA GATCATCCGC CGCTGCGCCG CGATCAAATG CTGGATCGTC 
ACCCGCGATC AGCGCGAGCA GACCGGCGAG CGCGCGCTGC TCAACCTCGG CCACACCGTG 
GGCCACGCCA TCGAGGCCGC CTGCGCCTAC GAGGGCATGC TGCACGGCGA GGCCGTCGCG 
CTCGGGCTGG TGGCCGCGTG CCGGGTCTCG GCGCGGCTCG GACAGTGCGC GGACGGGCTC 
GAGGAGCGGG TGCGCGCGAC CGTCGAGCGC GCCGGCCTCG ACGCTGATCT CGACCGCTGG 
CTGCGCGGCG ACGACGCCGA GCGGGTGTTG GGATTTCTGG CCACAGACAA GAAGCGCGCT 
GGCAAGCGCA TCGGTTTCGT CACCATCGGC GCGATGGGCG ATTGCGGCAT CACGCCCATC 
GAACTCGCAG AACTGGTGAG AATTTTGCGC CCCTAG

Protein sequence

MPRHVFLTGF MATGKSTVGR QLAARLRRPF LDLDDAVEAE AGHTVADIFA SEGEIGFRRR 
ERAALQRIAD GPAAVIATGG GAACHGDNLA QMRRSGLTIA LTAPLATARA RADAGERERP 
LLRATEAELE ALYRSREPMY RQAHACVRTE DSEPALLARE IAALVARAET LPDDAQEQAS 
WVALREGAYP VVVAEGGSDR VGTWLRSVLG ERRPSRVAVV SDDNVAPLHG ERVRRAIDGA 
DLCERPCSLH TVAAGERSKR FEVLGRLVDE LVAEGLDRSS LVVALGGGVV GDLAGFTAAC 
LYRGVPVVQV PSTLLAMTDA AIGGKTGIDI AAGKNLVGAF WQPRMVVVDP ALLATLPARE 
LRAAFGELIK YGLLDGEELY ARIEALADAL AAAGDEPGAA LSPAFTEIIR RCAAIKCWIV 
TRDQREQTGE RALLNLGHTV GHAIEAACAY EGMLHGEAVA LGLVAACRVS ARLGQCADGL 
EERVRATVER AGLDADLDRW LRGDDAERVL GFLATDKKRA GKRIGFVTIG AMGDCGITPI 
ELAELVRILR P