Gene Hoch_3581 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_3581
Symbol
ID	8545971
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	4934601
End bp	4935632
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	76%
IMG OID	646388250
Product	anthranilate phosphoribosyltransferase
Protein accession	YP_003267976
Protein GI	262196767
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0547] Anthranilate phosphoribosyltransferase
TIGRFAM ID	[TIGR01245] anthranilate phosphoribosyltransferase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.572943
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.0393169
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATCTCA AACAGGCAAT AGCGCAGGTG GTAGCCGGCC GCGATCTCGC CGGCGACGAG 
GTCGCTGCCG TGTTCGACAC GATCATGGCC GGCGAGGCCA CGCCGGCCCA GATCGGCGGC 
TTGCTCATCG GGCTGCGCAT GAAGGGCGTG AGCGCGGCCG AGCTCGCTGG CGCGGCGCGG 
GCCATGCGCG GCCGCGCGCG CGCGTTTCGC GCTCCCGAGC CCGAGCGCGC GGTCGACACC 
TGCGGCACCG GCGGCGACGG CTCGGGCAGC GTCAACGTCT CGACCCTGGC CGCCATCGTG 
GCCGCGGGCG CCGGCGCGCA GGTGGCCAAG CACGGCAACC GCGCGCTGTC CTCGCGCTCG 
GGCTCGGCCG ACGTGCTCGA GGTGCTGGGC GTCAACATCG AGGCCTCGCC CGAGACCATC 
ACCCGCTGCA TGCGCGAGGC CGGCATCGGC TTCTTGTTCG CGCCCGCCTT TCACGCGGCC 
ACGCGCCACG CCGCCGGGCC GCGCCGCGAG CTGGGCACGC GCACCATCTT CAACCTGCTC 
GGCCCGCTGA CCAACCCGGC CGGCGCCCGC AACCAGATCG TCGGCGTGTT CGACGCCGCC 
TGGTGCCAGC CGGTGGCCGA GGCCCTGGGC CAGCTCGGCG CGCGGCGCGC GTTCGTGGTC 
CACGGCGAGG GCGGCATCGA CGAGATCGCG GTCCGCGGCC GCACCCGCAT GGCCGCGTGG 
GACGAGGCCC GCGGCACGGT CGAGGTCTCC GAGATCACGC CCGCGGACTT CGGCCTCGAG 
GAGGCCGACC CGGCCGGCCT GGCCGGTGGC GACGCCCACG ACAACGCGCG CATTCTGCAG 
AGCGTGTTGG CAGGCGAGGC CGGCGCCGTG CGCAACGCCG CCGTGATGGA GGCGGGCGTG 
GCCCTGGTGG CCGCCGGCTG CGCCGACGAT CTGCGCGCCG GCGCCGAGCT GGCAGCGGCC 
GCCATCGACG ACGGCCGCGC GCGCGACGCG CTCGCCCGCT GGGCCGCGCT GTCGCAGGAG 
GACGCGGCGT GA

Protein sequence

MDLKQAIAQV VAGRDLAGDE VAAVFDTIMA GEATPAQIGG LLIGLRMKGV SAAELAGAAR 
AMRGRARAFR APEPERAVDT CGTGGDGSGS VNVSTLAAIV AAGAGAQVAK HGNRALSSRS 
GSADVLEVLG VNIEASPETI TRCMREAGIG FLFAPAFHAA TRHAAGPRRE LGTRTIFNLL 
GPLTNPAGAR NQIVGVFDAA WCQPVAEALG QLGARRAFVV HGEGGIDEIA VRGRTRMAAW 
DEARGTVEVS EITPADFGLE EADPAGLAGG DAHDNARILQ SVLAGEAGAV RNAAVMEAGV 
ALVAAGCADD LRAGAELAAA AIDDGRARDA LARWAALSQE DAA