Gene Hoch_3759 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_3759
Symbol
ID	8546152
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	5165405
End bp	5166475
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	73%
IMG OID	646388429
Product	phosphoribosylformylglycinamidine cyclo-ligase
Protein accession	YP_003268152
Protein GI	262196943
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0150] Phosphoribosylaminoimidazole (AIR) synthetase
TIGRFAM ID	[TIGR00878] phosphoribosylaminoimidazole synthetase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.261432
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.953602
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCATCA CCTACAAGGA CGCTGGCGTG GACATCGAAG AAGGTGCCCG CCTGGTCGAC 
GCCATCGCGC CGCTGGCCCG GGCCACCGCC CGCCCCGAAG TGCTCGGCGG CATCGGCGGC 
TTCGCCGGCC TGTGTGCCCT GCCCCCGGGC TATCGCCAGC CCATCTTGGT GAGCAGCACC 
GACGGCGTCG GCACCAAGCT CAAGTCGGCC CTGGCCACCG GCCGCCACCG CGGCATCGGC 
ATCGACCTGG TCGCCATGTC GGTCAACGAC GTCATCGTCA CCGGCGCCGA TCCCCTGCTC 
TTCCTCGATT ACTTCGCCAC CAGCCGCCTC GAGCTCGCGG TCGCGCGCGA GGTGGTCGCC 
GGCATCGCCG AGGGCTGCAC CCAGGCCGGC TGTGCCCTGG TCGGCGGCGA GACCGCCGAG 
ATGCCCGGCA TCTACAGCCC CGGCGACTAC GACGTCGCCG GCTTCTGCGT GGGCGTCGTC 
GAGCGCGACC AGATCCCGAG CGCCGATACC CTGCAAGCCG GCGATCTCGT CATCGGCTTG 
CCGTCCTCGG GCCTGCACGC CAACGGCCAC TCCCTGGCCC GCAAGCTGCT GCTCGAGCGC 
TTCTCCTACG ACGACGCGCC CGCGGCGCTG GCGGGCCAGA CCATCGCCGA CGTGCTGCTG 
CAGCCGACCC TGATCTACGC CTGGGCCTTC GCCGCGCTGC GCGAAGCCGG CCTCGCCGCC 
CTGGGCGCCG CCCACATCAC CGGCGGCGGC CTGATCGAGA ACCCGCCGCG CCTGCTGCGC 
ACCAGCACCG GCGCCGAGCG CGACGATCTC GCCCTGCGCT TCGACACCGA CACCTGGCAG 
ATGCCCGCTG TCATGCAGCT CATCGCCGAA GCCGGCGTCG AGGAGGACGA GATGCGGCGC 
ACCTTCAACA TGGGCATCGG CATGGTCCTC GTGGTCCGCG CGGCCGATGC CGAGCGCGTG 
CTCGCTGTCC TGGGCCGCGC CGAGCAAGCC GCGGGCGAGC GCGCGCCACG CGTCATCGGC 
GCCCTCGAAG CCCGGCCCGC GGGCGCCGCC GCGGTGCGGT TCGCGCCATG A

Protein sequence

MAITYKDAGV DIEEGARLVD AIAPLARATA RPEVLGGIGG FAGLCALPPG YRQPILVSST 
DGVGTKLKSA LATGRHRGIG IDLVAMSVND VIVTGADPLL FLDYFATSRL ELAVAREVVA 
GIAEGCTQAG CALVGGETAE MPGIYSPGDY DVAGFCVGVV ERDQIPSADT LQAGDLVIGL 
PSSGLHANGH SLARKLLLER FSYDDAPAAL AGQTIADVLL QPTLIYAWAF AALREAGLAA 
LGAAHITGGG LIENPPRLLR TSTGAERDDL ALRFDTDTWQ MPAVMQLIAE AGVEEDEMRR 
TFNMGIGMVL VVRAADAERV LAVLGRAEQA AGERAPRVIG ALEARPAGAA AVRFAP