Gene Veis_3025 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Veis_3025
Symbol	purH
ID	4691935
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Verminephrobacter eiseniae EF01-2
Kingdom	Bacteria
Replicon accession	NC_008786
Strand	-
Start bp	3379058
End bp	3380662
Gene Length	1605 bp
Protein Length	534 aa
Translation table	11
GC content	68%
IMG OID	639850783
Product	bifunctional phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase
Protein accession	YP_997776
Protein GI	121609969
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0138] AICAR transformylase/IMP cyclohydrolase PurH (only IMP cyclohydrolase domain in Aful)
TIGRFAM ID	[TIGR00355] phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.687258
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGCAC TCCTGTCCGT CTCCGACAAG ACCGGCATCG TCGAATTCGC GCAAGCCCTG 
CACGCGCTGG GCATAGGGCT GCTGTCCACC GGCGGCACGG CCAAGCTGCT GGCTGGCCAG 
GGTCTGCCGG TGACCGAGGT GGCCGAACTG ACGCAATGGC CCGAAATGCT CGACGGCCGC 
GTCAAGACGC TGCACCCCAA GGTGCACGCC GGCCTGCTCG CCCGCCGTGA ACGGCCCGGG 
CATATGGCGG CCCTGAAGGA GCATGGCATA GCCACCATCG ACCTGCTGGT GGTCAACCTG 
TACCCGTTCG AAGCCACCGT GGCCCAGGCC GCTTGCACGC TGGCCGAGGC CGTGGAGAAC 
ATCGACATCG GCGGCCCGGC GATGGTGCGC AGCGCGGCCA AGAACTGGCA GCATGTGGGC 
GTGCTGACCG ACGCCGCGCA GTACCCGTCC GTGCTGGCCG AGCTCCGCGC CAACGGCACA 
TTGTCCGACC CGCTGCGCTT TGCGCTGTCG GTGGCGGCGT TCAACCGCAT TGCGCAGTAC 
GACGCTGCGA TCAGCCACTA CCTGTCGTCG CTGCGGTTCG AGGCCGACCG TTGCATCGAC 
GACAGCGCGG TGCCGGCGCG CATGCAGTTC CCCGGCCAGA GCAACGCCAT CTTCAGCAAG 
GTGCAAGACC TGCGCTATGG CGAGAACGCG CACCAGCAGG CCGCGCTGTA TCGCGAACTG 
CACCCGGCCC CCGGCTCCCT GGTCACGGCC GAGCAATTGC AGGGCAAGGA GCTGTCCTAC 
AACAACCTGG CCGATGCCGA TGCCGCCTGG GAATGCGTCA AGAGCTTCGA CGCTGCGGCC 
TGCGTGATCG TCAAGCACGC CAACCCCTGC GGCGTGGCGC TGGGCCTGGA CGCAGCGAGC 
GCCTACCGCA AGGCTTTGCG GACCGACCCG ACCAGCGCCT TTGGCGGCAT CATCGCCTTC 
AACTGCGTGG TCGACGACGC GGCCGCCCGG CAGCTCGGCC AGCAGTTCGC CGAGGTGCTG 
CTGGCCCCTG ACTTCAGCGC GCAGGCGCTG GAGATCTTCA AAGCCAAGGC CAATCTGCGC 
CTGCTCAGGA TTGCGCTGCC CGTCCAGACC GGCCAGGAGG GCAAAGAGCG CGGCCGCAAC 
GCGCTCGATG CCCGGCGCAT CGGCTCCGGG CTGCTGCTGC AAACGGCAGA CAACCAGGAG 
CTGTCGCCGA GCGCGCTGCG GGTCGTGACG CACAAGCGGC CCGGCCCCGA AGCGCTGCAA 
GACCTGCTGT TCGCCTGGAA GGTCGCCAAA TACGTCAAGA GCAATGCCAT CGTGTTCTGC 
AAGGACGGCA TGACCATGGG CGTCGGCGCT GGCCAGATGA GCCGCCTGGA TTCGGCACGC 
ATCGCCAGCA TCAAGGCGCA GCAGGCCGGG CTGACGCTAC AGGGCACGGC CGTGGCCAGC 
GACGCCTTCT TCCCCTTCCG TGACGGCCTG GATGTGGTGC TCGACGCCGG CGCCAGTTGC 
GTGATCCAGC CCGGCGGCTC GGTGCGTGAC CAAGAGGTCA TCGATGCGGC CAACGAGCGC 
GGCGTGGCCA TGGTGTTCAG CGGCCTGCGG CATTTCCGCC ACTGA

Protein sequence

MNALLSVSDK TGIVEFAQAL HALGIGLLST GGTAKLLAGQ GLPVTEVAEL TQWPEMLDGR 
VKTLHPKVHA GLLARRERPG HMAALKEHGI ATIDLLVVNL YPFEATVAQA ACTLAEAVEN 
IDIGGPAMVR SAAKNWQHVG VLTDAAQYPS VLAELRANGT LSDPLRFALS VAAFNRIAQY 
DAAISHYLSS LRFEADRCID DSAVPARMQF PGQSNAIFSK VQDLRYGENA HQQAALYREL 
HPAPGSLVTA EQLQGKELSY NNLADADAAW ECVKSFDAAA CVIVKHANPC GVALGLDAAS 
AYRKALRTDP TSAFGGIIAF NCVVDDAAAR QLGQQFAEVL LAPDFSAQAL EIFKAKANLR 
LLRIALPVQT GQEGKERGRN ALDARRIGSG LLLQTADNQE LSPSALRVVT HKRPGPEALQ 
DLLFAWKVAK YVKSNAIVFC KDGMTMGVGA GQMSRLDSAR IASIKAQQAG LTLQGTAVAS 
DAFFPFRDGL DVVLDAGASC VIQPGGSVRD QEVIDAANER GVAMVFSGLR HFRH