Gene Dhaf_1478 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dhaf_1478
Symbol
ID	7258447
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfitobacterium hafniense DCB-2
Kingdom	Bacteria
Replicon accession	NC_011830
Strand	+
Start bp	1573661
End bp	1575217
Gene Length	1557 bp
Protein Length	518 aa
Translation table	11
GC content	53%
IMG OID	643561386
Product	phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase
Protein accession	YP_002457966
Protein GI	219667531
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0138] AICAR transformylase/IMP cyclohydrolase PurH (only IMP cyclohydrolase domain in Aful)
TIGRFAM ID	[TIGR00355] phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase

Plasmid Coverage information

Num covering plasmid clones	53
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATCGTC GAGCTGTGCT CAGTGTCTCC AATAAAACAG GTCTTGTGGA GCTTGCCCGA 
GGACTTGTGG AATTGGGCTT TGACTTGATT TCTACCGGCG GCACCTTTAA AACGTTGACC 
GAAGCGGGGC TGCCTGTTCG CTATGTTACC GAGGTCACGG GATTTCCGGA GATTCTGGAT 
GGGCGGGTCA AGACCCTTCA TCCCAGGATT CATGGGGGTA TTTTGGCCAG GGCTACGGCA 
GAGCATTTGC AGCAGCTGGA GGACAATGGC ATCGGGTTGA TCGATCTTGT GGTGGTCAAT 
CTCTATCCCT TTAAGGAGAC CATTGCCAGG CCGGGGGTTT CGTTCCAGGA GGCTATTGAA 
AATATCGATA TTGGCGGTCC TTCCATGGTT CGTGCGGCGG CAAAGAATCA GGAGCGGGTG 
AGTATCGTCG TCAATCCGGA GCGGTACCCG GAGGTGCTTC AGGCCCTGCG TGAGCAAGGG 
GAAATCTCTT ATGATATGCG TAAACGTTTG GCGGCAGAGG CCTTTGCCCA TACAGCCGAA 
TATGATCAAT GCATTGCCGG GTATTTGACT GCCGCACTTG CTGAGGAATC CGTTTCCTCT 
TCTTCTTCAC CTTTCCCTGC AACCATAACA CTTGGGGGCC AAAAGGCTCA GGATCTTCGC 
TATGGGGAAA ACCCTGCTCA GAAGGCGGCC TTTTACCGGG GGGCGGATGC AGCGGGCACC 
TTGGCCTATG GTGAACAGAT TCAGGGTAAA GAATTATCCT ATAACAATTG GATGGATATG 
GACGCGGCCT GGGGGATTGT TCAGGATTTC AGTGAGCCGG CCTGTGCTAT TATTAAGCAT 
ACCAATCCCT GCGGTACAGC CTTGGGGAAA ACTGCTTTGG AAGCTTATGA AAAGGCCCTG 
GCAGCGGACC CGGTCTCGGC CTTTGGCGGA ATTATTGCCT TTAACCGGAC CGTCGATGCT 
GAATGTGCCG CCTCACTTAA GGCTCACTTC TATGAAGTTA TCGTTGCCCA TGAGTTCAGC 
TCTGACGCCA GGGCAATACT ACAGGAAAAG AAAAACCTTC GTCTCGTCAA AGTAGCACAG 
GACGGGAAGC CAGCCCATAC GCCCTGGAAA GTTCGTTCCA TTCAAGGAGG ATTTCTAATT 
CAGGAAGAGG ATGAGGGGAC TACGCCGATC TCCGCATGGG AAGTCGTCAG CAAGCGCCAA 
CCTGAACCTG AAGAACTTCG TGAACTGGAC TTTGCCTGGC GGGTGGTAAA GCATGTTAAA 
TCCAATGCCA TTGTACTGGC CAAAGCCGGT CAAACCCTTG GCGTGGGAGC GGGACAGATG 
AATCGGGTTG GCTCAGTTAA GATTGCTTTA GAACAGGCGG GGGATAAAGC CCAAGGGGCT 
TATCTGGCCT CCGATGCTTT TTTCCCATTC CCCGATTCCC TGGAGGAGGC GGCTAAGGCA 
GGAGTGCGGG CTGTGGTTCA ACCGGGGGGC TCCGTCAGAG ATGCTGAGGT TATCGAAGCG 
GCTGACCGTT TGAATTTGAT TATGGTGTTT ACGAACCGCC GTCACTTTAA GCACTGA

Protein sequence

MNRRAVLSVS NKTGLVELAR GLVELGFDLI STGGTFKTLT EAGLPVRYVT EVTGFPEILD 
GRVKTLHPRI HGGILARATA EHLQQLEDNG IGLIDLVVVN LYPFKETIAR PGVSFQEAIE 
NIDIGGPSMV RAAAKNQERV SIVVNPERYP EVLQALREQG EISYDMRKRL AAEAFAHTAE 
YDQCIAGYLT AALAEESVSS SSSPFPATIT LGGQKAQDLR YGENPAQKAA FYRGADAAGT 
LAYGEQIQGK ELSYNNWMDM DAAWGIVQDF SEPACAIIKH TNPCGTALGK TALEAYEKAL 
AADPVSAFGG IIAFNRTVDA ECAASLKAHF YEVIVAHEFS SDARAILQEK KNLRLVKVAQ 
DGKPAHTPWK VRSIQGGFLI QEEDEGTTPI SAWEVVSKRQ PEPEELRELD FAWRVVKHVK 
SNAIVLAKAG QTLGVGAGQM NRVGSVKIAL EQAGDKAQGA YLASDAFFPF PDSLEEAAKA 
GVRAVVQPGG SVRDAEVIEA ADRLNLIMVF TNRRHFKH