Gene Hoch_5617 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_5617
Symbol
ID	8548031
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	7712628
End bp	7714181
Gene Length	1554 bp
Protein Length	517 aa
Translation table	11
GC content	77%
IMG OID	646390288
Product	transglutaminase domain protein
Protein accession	YP_003269990
Protein GI	262198781
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1305] Transglutaminase-like enzymes, putative cysteine proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.0710722
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACATCT TCGAGGCGGG CCACGGCCGC CCATTGTGCC CCGTCCTCGG CGGCGGCGCT 
ACGATCGGCT ACGATAGCAG CGTGCTGCGG GTGCTGATGG CCATCGCGAT CGCGACCAGC 
GCGCTCCACT GCGCGCCGCG TTCGACGCCG GAGTGGACGT CGCCCGCGCC CGAGGGGCCC 
GTGCCCCAGG CCTCGCTGAT CGGCTACGAG GCGCACTTTC ACATCACCTG GAACGGCGCC 
CGCATCGGCG ATGCCCACGA GAGTCTGCGC GCCCAGGACG AGGGCCTGCG CTTCTCGCGC 
GGCGAGCATA TCGCCGCCCG CCGCGGCGAC GCAGTGGTCC ACGGCGAGAC CAATATCGCC 
ATCGACACCG ACGCCGCGCT GCGCGCCGAG CGCGTGGCCC TGCGCCAGCT CGCCAGCGGC 
GCCGAACGCC GCGGCACGGC CGAGCGCAAC GCGCGCGGCG ACTGGGTGGT GCGCTTCGCC 
GACGAGCCGC TGCGCCAGCT CCCGGGCGAG GTGGTCCCGG CCGAGCTGGT GCCGCTGCGC 
ATCGCGGCCG CGGCACAGAG CGCGGCCGTG CCCTTCGACG GCGCCGTGAT GCTGCCCGGC 
TATGGCTTCG CCGTGGCCCA CCTGCGCGTG GACCGGGAGG CGCCGCAGCG CCTGCTGGCC 
ACCTTGACCA TCGACGACGG CGCGGCCGTG CTGCGCAGCC GCTTCCACCT GGCGCAGAAC 
GGCACCCTGG TGCGCATCGA GGGCGAGGAC GGCAGCGGCT CGCGGCGCGT CGATGCCGCG 
GCCGCGGCCG AGCCCTTCGC GCCGCCCGAG ATCGTCGACA GCGCCAGCAT CGCGCTGGCC 
CCGCCGCGGC CCGCGGGCGC GGGCGAATCC AACAGCCTGG TGCTGGGCCC GATCGCGCGC 
GAGCGTCCGC CGCCGCCGCC GCTGCCGGGA CAGCACATCG AGATCCTGGG CGACGCCTGG 
CATGTGCGCC TCGGCGCCGG CGACGCCCTG CCGCCGCTGG TTCACGCGAC GCCGTATCGC 
GCGCTGGCGC CGAGCGCCGC GCTCGACGCC GAGGCCGCCG CGCTGGCCGC CGAGATCGTC 
AGCGCCTCCC GGGTGCCGCC GGGACGCCGG GCCGCGGCCT TTGCGCTGGC CCGGGCCACC 
GCCTCGCTGC TCGCCGACGA CCTGGGCACA CCGGGCGACA CCGCGCGCAC CGCGCTGATG 
CTCGGCCGCG GCGACTGCAC CGCCCACGCG CTGCTGTTCG CCGAGCTCGC CCGCGCCCGC 
GGCATTCCCG CGCGCCTGGT CACCGGCTAT CGCATCGACG GCGCTCGCCT GCTGCGCCAC 
CGCTGGGCCA TCGTCGCCCT CGACGGCGAG TGGATCGCGG TCGATCCCAC CTACGGCGAG 
GCCCCGGCCG CGCCCCGGCT CATCGGTCTG GCGGTCCACG GGCCGCGCGC CGCCGAGCTG 
GCCATGGCCG ACGAGGCCGC CTTCGCCGGG CTGGCGCGGG TGCGCGCCTT CGCGTGTCCG 
AGCGCCGAGA TCAGCGCCCG GCTGTGCGAC CCGTCCAGTC TTCGTATTCC TTGA

Protein sequence

MHIFEAGHGR PLCPVLGGGA TIGYDSSVLR VLMAIAIATS ALHCAPRSTP EWTSPAPEGP 
VPQASLIGYE AHFHITWNGA RIGDAHESLR AQDEGLRFSR GEHIAARRGD AVVHGETNIA 
IDTDAALRAE RVALRQLASG AERRGTAERN ARGDWVVRFA DEPLRQLPGE VVPAELVPLR 
IAAAAQSAAV PFDGAVMLPG YGFAVAHLRV DREAPQRLLA TLTIDDGAAV LRSRFHLAQN 
GTLVRIEGED GSGSRRVDAA AAAEPFAPPE IVDSASIALA PPRPAGAGES NSLVLGPIAR 
ERPPPPPLPG QHIEILGDAW HVRLGAGDAL PPLVHATPYR ALAPSAALDA EAAALAAEIV 
SASRVPPGRR AAAFALARAT ASLLADDLGT PGDTARTALM LGRGDCTAHA LLFAELARAR 
GIPARLVTGY RIDGARLLRH RWAIVALDGE WIAVDPTYGE APAAPRLIGL AVHGPRAAEL 
AMADEAAFAG LARVRAFACP SAEISARLCD PSSLRIP