Gene Hoch_1557 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_1557
Symbol
ID	8543939
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	2123658
End bp	2125331
Gene Length	1674 bp
Protein Length	557 aa
Translation table	11
GC content	65%
IMG OID	646386266
Product	X-Pro dipeptidyl-peptidase domain protein
Protein accession	YP_003266001
Protein GI	262194792
COG category	[R] General function prediction only
COG ID	[COG2936] Predicted acyl esterases
TIGRFAM ID	[TIGR00976] putative hydrolase, CocE/NonD family

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.198824
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAGGCAG CATCACAACG GATTTTGGGT ATCGCGCTTT GTTTCGCGGC GAGCGCATGC 
ACCGCCGAGT TCACTCCCGA AGCGGACCAT GGCGACCAGG TATTCGCAGA GAGCATCGCA 
AAAGGCATAT CAGATACCTC GGCGTCCGCA TTCGCGGGCA CCGAGCAGCT CGATTTCACC 
TTTCGAGACG GCATCACCTT GAGTTCGGCG GACGGCACCG CGATCACGGG CAACGTGTTC 
GAGCCCACCG AGGGCGCGCC GGACACGCTT CCCGCGGTGG TCTTCGTCAA TAGCTGGGCG 
CTCAACGAGT ACGAATACCT GGTGCCGGCG GCCGAGCTAG CATCGCGCGG CTACGTGGTC 
ATGAGCTACA ACACCCGCGG TTTTGGTACC TCGGGTGGCC TGATCAACGT CGCTGGCCCG 
GGCGACATGG AAGATCTGTC AGCGGTTCTC GATTGGATGG ACGAAAATAC CGACGCCGAT 
ATGGACCGGG TCGGCATCGC GGGGATTTCG TACGGCGCCG GCATCTCGCT GCTGGGCCTG 
GCCCAGGAGG GCCGCATCCG CACCGCGGTG GCCATGAGCG GCTGGGGCGA TCTCTACGAC 
TCGCTCTATA AAGATGATAC GCCGCGCCTG GCCTGGGGCC TGATTCTCAT CGCCTCGGGC 
TACTTCACCG GGCGCATGGA CCCGATCATC GCGCAACAGT TCCAGCGCCT GCTCAGCCAC 
GAGGACATCG ACGAGGTGCA GAGCTGGGCG GCGGTGCGTT CACCGGCCAG CTACGTCGAC 
GCGCTCAACG CCAGCGGCAA GCCGGTGTAC ATCAGCAGCA ACCTCTCGGA CACGCTGTTC 
AACCCCAACC AGATGCTCGA CTTCTACGAG CGCCTCACCG GCCCCAAGCG CCTCGATTTC 
AACCTCGGCA CCCACGCGAC CGCGGAGGCG CCCGGCCTCT TCGGCCTGTC CAACTACGTG 
TGGAACAACG CCTACGACTG GCTCGACTAC TGGCTGCGCG ACATCGATAA CGGCATCACC 
GCGCGCCCGC CCGTGACCAT CGAGAAGAAG TACAGCCACG AGCGCGTAGA GCTCGACGAT 
TGGCCGGCGC AGGGCATTGC GGCGACGCAG ATGTATCTGA CGCCGCGCCT GCTCTCCGAT 
GGCTCGCTGT CGTCCAATCC CAACGGCATG TCGATCAGCA ACCGCATCTG GTCGGGCGTG 
GGTACGCTGG CGTCCACGGG CATCCCGCTG CTGTCCGATA TCCTCGATTC GCATCTCGAC 
GTGCCCGTGA CCGCGTCGCT GCCGCTGATC GACCGGCTGC GCGGCTTCAC CTTCTGGTCG 
GGCTCGTTCT CGGGCGGCCT CGAGATCATC GGCCGGCCGC AGGTCAACCT GCGTCTGGTC 
TCGGGCGCGG ATACCGCCCA CGTGGTCGTG TATCTCTACG ACGTCGATGC CTTTGGCACC 
GGCACGCTGA TCACCCACGG CACCGCATCG CTGCACGACA TCGCCGCGGG CCAGGTGCAG 
ACCCTCGAGG TCGATCTCAA CGCCGTGGCC TACGACCTGC CCCGCTACCA TCGCCTGGGC 
ATCGTCATCG ACACCGTGGA CCCGCTGTAC GCCAGCCGCA CGCCGGGCGG CACGGCCACC 
GACCTGCCGT TCTCGGTTTC GGGACAGATG GGTCTCGAGC TCCCGGTCCG CTGA

Protein sequence

MKAASQRILG IALCFAASAC TAEFTPEADH GDQVFAESIA KGISDTSASA FAGTEQLDFT 
FRDGITLSSA DGTAITGNVF EPTEGAPDTL PAVVFVNSWA LNEYEYLVPA AELASRGYVV 
MSYNTRGFGT SGGLINVAGP GDMEDLSAVL DWMDENTDAD MDRVGIAGIS YGAGISLLGL 
AQEGRIRTAV AMSGWGDLYD SLYKDDTPRL AWGLILIASG YFTGRMDPII AQQFQRLLSH 
EDIDEVQSWA AVRSPASYVD ALNASGKPVY ISSNLSDTLF NPNQMLDFYE RLTGPKRLDF 
NLGTHATAEA PGLFGLSNYV WNNAYDWLDY WLRDIDNGIT ARPPVTIEKK YSHERVELDD 
WPAQGIAATQ MYLTPRLLSD GSLSSNPNGM SISNRIWSGV GTLASTGIPL LSDILDSHLD 
VPVTASLPLI DRLRGFTFWS GSFSGGLEII GRPQVNLRLV SGADTAHVVV YLYDVDAFGT 
GTLITHGTAS LHDIAAGQVQ TLEVDLNAVA YDLPRYHRLG IVIDTVDPLY ASRTPGGTAT 
DLPFSVSGQM GLELPVR