Gene DET1417 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	DET1417
Symbol	purH
ID	3229270
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dehalococcoides ethenogenes 195
Kingdom	Bacteria
Replicon accession	NC_002936
Strand	+
Start bp	1287504
End bp	1289045
Gene Length	1542 bp
Protein Length	513 aa
Translation table	11
GC content	54%
IMG OID	637120977
Product	bifunctional phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase
Protein accession	YP_182125
Protein GI	57233807
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0138] AICAR transformylase/IMP cyclohydrolase PurH (only IMP cyclohydrolase domain in Aful)
TIGRFAM ID	[TIGR00355] phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGGGCTA TCCTGAGCGT CTCAGATAAA ACCGGTCTTA TCGAATTCGC CAAAGGCTTG 
TCAGAACTGG GTTTTGATAT ATACAGCACC GGCGGAACCA AGAAATCACT CCAGCAGGCA 
AATGTAACCG TTCACGGCAT TTCGGACATG ACCGGTTCGC CTGAAATACT GGACGGACGG 
GTCAAAACTT TGCATCCCAA GGTACACGGC GGCATACTGG CCCGGCGTGA CCTGCCCGAA 
CATATGGCCG AACTGGAAGA ACACCATATC CAACCCATTG ACATGGTGGT AGTCAATCTC 
TACCCCTTTG TCAAGACTGT TTCCCGGCCG GATGTAAGCC TGACTGATGC ACTGGAGAAT 
ATTGATATCG GCGGACCTAC CATGATACGG GCTTCCGCCA AGAACTTCCC CAGTGTGATT 
GTGGTGGTAG ACCCTCAGGA TTACTCCCGT GTACTGGAAC ACCTTCAGGC AGGCACTCTG 
AGCCTTGACG AACGCAAGAA ACTGGCCCAA AAGGCCTTCC AGCACGTAGC CATGTATGAT 
ACGGCCATCT CCCAGTACCT CTGGCAGGGA GAAGAGGGTT TCCCCGAAAA TATGACCATA 
GCCCTTTCCA AACGCTATGA CCTGCGTTAC GGTGAAAACC CCCACCAGCC GGCTGTTTTC 
TATGCTGAAA ACAGGGTTGG ACAAGGGCAG GACAGCGGCA TTACCTGGGC GCAGCAGGTC 
TGGGGCAAAC AGCTTTCCTT TAACAATATT CTGGACGCAG ACGCCGCCTG GGGAGCCGCC 
ACTGACTTTG CGGCTGCCAC AGTAGCCATA GTCAAGCATA CCAATACCTG CGGTCTGGCC 
AGTGACGAAA ACATTGCCGA AGCCTACAAG AAGGCCTTTT CGGGTGACCC CGTTTCGGCT 
TACGGCGGTA TAGTAGCCTC CAACCGCAAA GTGACACTGT CCATGGCCGA AGCCATGAAG 
GGTGTCTTTT ATGAAATCAT CATTGCCCCC GAATACGAAC CGGAGGCACT GGAATTCCTT 
AAAACCCGCA AGGATTTGCG TATACTCATA GCCGAACTGC CCAAACATGC GGAAAACAAG 
GCCGCTTCGC TGGATTACCG CCGGGTAAAA GGCGGGCTGC TGGTGCAGGC GGCTGATGAA 
CTGGCCGAAG AGGCCCTTCA GACCAAGGTA GCCACCAACC GGGCACCCAC CGCTGAGGAA 
ATGGCAGATT TGAAATTCGC CTGGCGGGCA GTCAAGCATA TTAAATCAAA CGCCATTGTC 
CTGGCTAAAA ATAAAGTCCT GCTGGGAATG GGCGCAGGGC AACCCAACCG AGTAGTCAGC 
GTAGACATTG CCAAGAGCAA GGCCGGTGAG GCCTCAAAGG GCAGTGTCAT GGCCTCAGAT 
GCCATGTTTC CCTTCCCTGA CAGCGTTGAA CAGGCGGCTG CCGCCGGAGT AACCGCCATT 
ATCCAGCCGG GCGGTTCTAT CCGTGACCAG GAATCTATTG ACGCTGCCAA CAAGTACAAT 
ATAGCTATGG TATTTACCGG TACCCGCCAC TTCCGCCATT AG

Protein sequence

MRAILSVSDK TGLIEFAKGL SELGFDIYST GGTKKSLQQA NVTVHGISDM TGSPEILDGR 
VKTLHPKVHG GILARRDLPE HMAELEEHHI QPIDMVVVNL YPFVKTVSRP DVSLTDALEN 
IDIGGPTMIR ASAKNFPSVI VVVDPQDYSR VLEHLQAGTL SLDERKKLAQ KAFQHVAMYD 
TAISQYLWQG EEGFPENMTI ALSKRYDLRY GENPHQPAVF YAENRVGQGQ DSGITWAQQV 
WGKQLSFNNI LDADAAWGAA TDFAAATVAI VKHTNTCGLA SDENIAEAYK KAFSGDPVSA 
YGGIVASNRK VTLSMAEAMK GVFYEIIIAP EYEPEALEFL KTRKDLRILI AELPKHAENK 
AASLDYRRVK GGLLVQAADE LAEEALQTKV ATNRAPTAEE MADLKFAWRA VKHIKSNAIV 
LAKNKVLLGM GAGQPNRVVS VDIAKSKAGE ASKGSVMASD AMFPFPDSVE QAAAAGVTAI 
IQPGGSIRDQ ESIDAANKYN IAMVFTGTRH FRH