Gene Hoch_0602 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_0602
Symbol
ID	8542984
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	808733
End bp	811783
Gene Length	3051 bp
Protein Length	1016 aa
Translation table	11
GC content	75%
IMG OID	646385397
Product	PglZ domain protein
Protein accession	YP_003265132
Protein GI	262193923
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCGCCG ACGCCCGCGC CCCCGGCGCC CGCGCCCCCG GCGTCCGGGA CAGCGACGAC 
GCCAGCCGCG CCCAGCGCCT CGGCCTGGGC CCGGTCTCGG CCGCGCTCGA GCGCGACCTG 
CGCCAGTTCG TGCGCCGCCA CGGCCTGAGC GTGTGGCTCG ACCCGGCCGG TCACTACACC 
GAGCTGGTCG ATCATCTCGC GCAGCTCCCG AGCGCGCCCG AACCCGGACA CCTGGACTAC 
GAAGTCCGCG CATTCCGCGG CAGCTACCTG GCGCTGATGC ACGAGCTGGC CAACCTCACC 
AGCGGCGTGC ACCCGCCGCG CCTGCTCGTA CACCTGCCCG GCCTCAACGA TCGGAGCATC 
AGGACCACGC CGCTGTACGA GCTGTACAAA GCCGGCAAGT GCTACAGCAA GAGTTTGGAC 
ACGGCCGTGA GCGAGGCCGC GGCCGGGCGC GTGCCGCCCG ACGACTTGGC CGCCTTGTGC 
GCGCGCGCCG ACCTCAGCCT GGCAGCCGCC GACGCGTGGC TGAGCGAGCG CGTCAGCGGC 
GGCGTGGGCG GCGGCCTGCG CGCGACCCTG GAGAACATCA GCGCGAGCGC GCTCATCGGC 
GACCTGCTGC GCGGCGAGGG CGTGGCCACG CGCCTGCGCG ACCCCGGCGA CGCGGCCGCG 
CTGTGGGCGC ACCTCGAGGC CGCCCTGGGC CTGCGCGCCG ACTGGGCCAG GTCGACCGGC 
GCAGGCGAGG CCGCCGATGC CGACGCCGAC CCCGGCGCCC AGGTCGGCGC CCAGGCCGAC 
ACCGTGCGCG CCGAGGACGT GGCCTTTGCC ATGGCGAGCT GGGCGCAGGC GGTCGAGTAC 
GTCGGCGACC TGCGGCGCCC GCCGGTGTCG CCGCTCTTGG CCGGCGTGAG CGCGCTGCCG 
GCGGCCGTGC GCACGGCCTG CGGCGAGCTG GCCGAGCACC TGCGCCAGGC CCACGCCGAC 
TTCTACCGGC GCACGGCCGA CGAGACCGAG GACCGGCTCG CCGACGAGGT CGCGGCCGCG 
CGCGCCGAGG ACCTGGGCCG CATCGACACC TTCCGCTTCG AGGAGGACAA GATCCTCGAG 
GCCGCCATCG CCGCCTTGCG CGCGCGCGAA TTCGACCGCG CGTCCGAGTA CGTGCAGGTG 
CGCGCCGGCC TGCGCTCGCC CTGGGTCGCC CTCGACGCCG GCCGCCGGGC CGCGTGGCAG 
CTCGTGGCCG CCGCCACCGC CCTGGGCCAG GCCATCGCCG ACGCCGGCGC CAAGCTCGCG 
GCCAACGATC ACGACGCCGC CCTGGCCGCG TACTGCGAGC GCGGCGCGCG CGTCGACCGC 
CTGCACCGCG AGCTCGAGCA GGCGCGCTTC AAGCTGCTGG GCCCGCAGGT GCCGCGCTTC 
GACGCCGTGC GCGCGTGTCT CGACGACCTG CGCGCGGCCT GGCGCGCCTG GGCCGACGCC 
TGGGCCGAGG GCTTCACCGT CCTGTGCGAG CGCGACGGCT TCTTGCCGCG CGCCGAATTG 
CAGCAGCGCC ATCTGTTCGA CGACGTCGTC CGCGCGCACG CCCAGGCCGG CACCACCGCG 
CTGTTTCTGG TCGACGCCCT GCGCTACGAG ATGGCCACCG CGCTGCTCGC CGCCATCGTC 
AACATCGATG GCACCGCCGC CACCAGCGTC CGCCTCGACG CCCGCTTCGC CGAGCTGCCC 
ACGGTCACCG AGGTCGGCAT GAACGCGCTC GCGCCCGTGA GCGCGCGCGG CCGGCTCACG 
CCCAAGATCG CGAACGGCAC GTTCCAGGGC TTCTCGGCCG GCGAGTTTCA GGTCAAGGAC 
CCCGAGACCC GGCGCCGGGC CATGGGCGCG CGCGTCGGCG GCAGCACCTG CCCGCTGCTG 
AGCCTGAGCG AGGTGCTCGC GCGCGACGCC CGCTCGCTCA AGCACAGCGT GGCCCAGGCG 
CGCCTGGTCG TGGTCCACAG CCTGGAGATC GACCAGGCGG GCGAACACGG CACCGGCCTG 
GCCGCGTTCG AGGACGCCTT GCACACGCTG CGCAACGCCT GGCAGCTCTT GCGCGACGCC 
GGCATCAAGC GCTTCGTGTT CACGGCCGAC CACGGCTTCT TGCTGCTCGA CAGCGGCGCC 
GGCTCGGGCG GCGCGGCGGC GGCCCAGGCC CACGGCCGCA AGATCGACCC CAAGCGCCGG 
CACGTCATCT CGTCCGTGGC CGCCGACCAC AGCGGCGAGG TGCGCGCCCC GCTGAGCGCG 
CTCGGCTACG ACGGCAGCGA GCTACACGCC ATGTTCCCGC GCACCTGCGC GCCCTTTGAC 
ACCGGCGCCC GCGCGCGCGA TTTCGTCCAC GGCGGCAACA GCCTGCAGGA GCGCGTCATC 
CCGGTGCTCA GCGTCGTGCA CCGCAGCGAC GCCGGCGGCA CCACCCTGCG CTACCGCGTC 
GAGGTCACGG ACAGGGACAA GCCGCTGGGC GACCTCGGCG GCGTGCACCG GCTGCGCGCG 
GGCGTGCGCG TGGCCGGGCA GAGCGCGCTC GATTTTGGCG CCGCGGGCGA GATCGAGCTG 
GCGCTGCGCG CGCGCGAGCC GGCCGATGTC AGCGCCGAGC TGGTGAGCGT GAGCGGCGGC 
GCGCGCATCG AGGGCGGGCG GCTGCTCGCC AAGGTCGGCG AGGACTTCGA GCTGCACTTT 
CGCCTCTCCG GCAACACCGA AGCGCGCGCG CTGGTCGAGC TGCACCACCC CGGACGCAGC 
GCCGAGCTCG AGCCCGGCGG CCCGGCCCGG CGCTTCTCGG TGACGCCGGC GGTGAAGCAA 
CGCCCAGCGG ACGCGGAGCC GACGTCCGCC GCGGCAGCCA GTGAAGCCGC GCGCGCGCCC 
GCGGCGTCGT GGCTGGCCCA GCTCCCGGCC GGCGTGCGCG AGGTGTTCGC GCACATCGAG 
GCGCACGGCG TGTGCGTGGA GAACGAGGCC AGCGCCCTGC TCGGCGGCGC CCGCAAGCTG 
CGCCGGTTCT CGGCCGAGTT TGAAAAACAC GCCGCGCTCG CGCCCTTTGG CGTGCGCATC 
GACACCGTCG GCGGCATCAA GCGCTACGTG AAAGAGGGAA CCCGGACATG A

Protein sequence

MSADARAPGA RAPGVRDSDD ASRAQRLGLG PVSAALERDL RQFVRRHGLS VWLDPAGHYT 
ELVDHLAQLP SAPEPGHLDY EVRAFRGSYL ALMHELANLT SGVHPPRLLV HLPGLNDRSI 
RTTPLYELYK AGKCYSKSLD TAVSEAAAGR VPPDDLAALC ARADLSLAAA DAWLSERVSG 
GVGGGLRATL ENISASALIG DLLRGEGVAT RLRDPGDAAA LWAHLEAALG LRADWARSTG 
AGEAADADAD PGAQVGAQAD TVRAEDVAFA MASWAQAVEY VGDLRRPPVS PLLAGVSALP 
AAVRTACGEL AEHLRQAHAD FYRRTADETE DRLADEVAAA RAEDLGRIDT FRFEEDKILE 
AAIAALRARE FDRASEYVQV RAGLRSPWVA LDAGRRAAWQ LVAAATALGQ AIADAGAKLA 
ANDHDAALAA YCERGARVDR LHRELEQARF KLLGPQVPRF DAVRACLDDL RAAWRAWADA 
WAEGFTVLCE RDGFLPRAEL QQRHLFDDVV RAHAQAGTTA LFLVDALRYE MATALLAAIV 
NIDGTAATSV RLDARFAELP TVTEVGMNAL APVSARGRLT PKIANGTFQG FSAGEFQVKD 
PETRRRAMGA RVGGSTCPLL SLSEVLARDA RSLKHSVAQA RLVVVHSLEI DQAGEHGTGL 
AAFEDALHTL RNAWQLLRDA GIKRFVFTAD HGFLLLDSGA GSGGAAAAQA HGRKIDPKRR 
HVISSVAADH SGEVRAPLSA LGYDGSELHA MFPRTCAPFD TGARARDFVH GGNSLQERVI 
PVLSVVHRSD AGGTTLRYRV EVTDRDKPLG DLGGVHRLRA GVRVAGQSAL DFGAAGEIEL 
ALRAREPADV SAELVSVSGG ARIEGGRLLA KVGEDFELHF RLSGNTEARA LVELHHPGRS 
AELEPGGPAR RFSVTPAVKQ RPADAEPTSA AAASEAARAP AASWLAQLPA GVREVFAHIE 
AHGVCVENEA SALLGGARKL RRFSAEFEKH AALAPFGVRI DTVGGIKRYV KEGTRT