Gene Hoch_1072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_1072
Symbol
ID	8543454
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	1374390
End bp	1375898
Gene Length	1509 bp
Protein Length	502 aa
Translation table	11
GC content	71%
IMG OID	646385819
Product	Integrase catalytic region
Protein accession	YP_003265554
Protein GI	262194345
COG category	[L] Replication, recombination and repair
COG ID	[COG4584] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCAGCC AGGAGCGCGA GGCGCAGATC CTGCGCCTGC ACCACGTCGA ACGCTGGCGC 
GTGGGCACGA TCGCGCAGCA CCTGGGCGTG CATCACACGA CCGTGCAGCG GGTGCTGACG 
CAAGCGGGCC TCACGCCGCG GATGCAGGTG ACGCGGCCGT CGATGGCCGA GCCGTACATT 
CCGTTCATCG TCGACACCTT GTCCAAGTAC CCGCGCCTGT GCGCCAGCCG GCTGTTCGAC 
ATGGTGCGCG AGCGCGGCTA CCCGGGCGGC CCCGACCACT TTCGCCGCGT GGTCGCCCGC 
CTGCGCCCGC GCCCGCCGGC CGAGGCCTAC CTGCGCCTGC GCACGCTGCC CGGCGAGCAG 
GCGCAGGTGG ACTGGGCCCA CTTCGACAAG GTCACGATCG GCGCGGCGTC TCGGCGCCTC 
TACGCGTTCG TGATGGTGCT GTCGTGGTCG CGGCAGATTT TCTTGCGCTT CTACCTCAGC 
GCCGCCATGC CCTGCTTCCT GCGCGCTCAC GTCGAGGCGT TCGACTTCTT CGGCGGCGTG 
CCGCGCGTCC TGCTCTACGA TAACCTCAAG AGCGCGGTTC TCGACCGCGT GGGCGACGCC 
ATCCGCTTCC ACCCAACGCT GCTCGAGCTC GCCGCCCACT ATCGCTACGA ACCGCGTCCC 
GTGGCGCCCG CGCGCGGCAA CGAGAAAGGC CGCGTCGAGC GCGCCATCCG CTACGCGCGC 
GACAATTTCT TCGCCGCGCG CTCGTGGACC TCGGTCGCAG ACCTCAACGA ACAGGCCCTG 
AGCTGGTGTA CGGGGTTGGC CGCCGAGCGT CCGTGGCCGC AAGAGCGCGC GCGCTGCGTG 
GGCGACGTCT TCGCCGAAGA ACGTCCGCGC CTGCTGGCTC TGCCGGACAA CGCGTTCCCC 
TGCAACGAAC GGCTCGAGGT CCACGTCGGC AAGACGCCCT ACGTCCGCTT CGACCTCAAC 
GACTACTCCG TGCCGCACGA GCATGTCCGC AAGACCTTGG TCGTCGACGC ATCGCTCGAC 
CTCGTGCGCG TCCTCGACGG CGCCGACGTC ATCGCCACCC ACGCGCGCTC ATGGGACCGC 
GGACAGCAGG TCGAGAACCC AGAGCATGTC GCCCGACTGG TCGAATTCAA GGCCCGCGCC 
CGCCGCAGCC GCGGCCTCGA CCGCCTCGCC CGCGCCGCAC CATCCGCCGA GCAGCTCCTG 
CGCCTCGCCG CCGAGCGCGG CGGCAACCTC GGCAACATCA CCGCCCGTCT GCTCGCGCTC 
CTCGACGCCG TCCCCGCCGC CGAACTCGAA CGCGCCGTCG CCGAGGCCGT CGAGAAACAG 
CTCCCCACCG TCGGCGCCGT GCGCCACATC CTCGACCGCC ATCGCGCCGA GCGCGGCGCG 
CCGCCTGCCA TCGCCCACCG CTTCGCCGCC CGCGTGAGCG AGGTCGTCGT CCGCCCCCAC 
GACCTCTCCA CCTACGATTC GTTTCACAAG GACAGCACCG ATGACCCCAC CGACCCTGCC 
GACTGCTGA

Protein sequence

MISQEREAQI LRLHHVERWR VGTIAQHLGV HHTTVQRVLT QAGLTPRMQV TRPSMAEPYI 
PFIVDTLSKY PRLCASRLFD MVRERGYPGG PDHFRRVVAR LRPRPPAEAY LRLRTLPGEQ 
AQVDWAHFDK VTIGAASRRL YAFVMVLSWS RQIFLRFYLS AAMPCFLRAH VEAFDFFGGV 
PRVLLYDNLK SAVLDRVGDA IRFHPTLLEL AAHYRYEPRP VAPARGNEKG RVERAIRYAR 
DNFFAARSWT SVADLNEQAL SWCTGLAAER PWPQERARCV GDVFAEERPR LLALPDNAFP 
CNERLEVHVG KTPYVRFDLN DYSVPHEHVR KTLVVDASLD LVRVLDGADV IATHARSWDR 
GQQVENPEHV ARLVEFKARA RRSRGLDRLA RAAPSAEQLL RLAAERGGNL GNITARLLAL 
LDAVPAAELE RAVAEAVEKQ LPTVGAVRHI LDRHRAERGA PPAIAHRFAA RVSEVVVRPH 
DLSTYDSFHK DSTDDPTDPA DC