Gene Hneap_0052 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hneap_0052
Symbol
ID	8533165
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothiobacillus neapolitanus c2
Kingdom	Bacteria
Replicon accession	NC_013422
Strand	+
Start bp	58846
End bp	60408
Gene Length	1563 bp
Protein Length	520 aa
Translation table	11
GC content	61%
IMG OID	646382431
Product	phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase
Protein accession	YP_003261965
Protein GI	261854682
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0138] AICAR transformylase/IMP cyclohydrolase PurH (only IMP cyclohydrolase domain in Aful)
TIGRFAM ID	[TIGR00355] phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAATA ACCGCACCAC TCCTCGCCGC GCCTTGTTGA GCGTGTCGGA CAAAACCGGC 
CTGTTGGCAT TCGCCCAGAG CTTGAATCGG CACGGCGTGG CGCTGATTTC CACTGGCGGC 
ACGGCCAGTA TGCTGCGTGA TGCGGGCCTG CCCGTGACCG AAGTGGCCGA TGTGACCGGT 
TTCCCCGAAA TGATGGCCGG ACGGGTCAAG ACACTGAACC CGAAGATTCA TGGTGGCATT 
CTGGCCCGAC GCGGTGTGGA CGAGGACGTG ATGGCTGAGC ACGGCATCGA GCCGATCGAC 
ATCGTGGTCG TGAATCTCTA CCCGTTTGCC GAAACCGTCG CCAAGCCGAA CTGCCAGTTT 
GACGATGCGG TCGAAAACAT CGATATCGGT GGCCCGGCCA TGGTGCGTGC GGCGGCGAAA 
AATCATCAAG ATGTCGCGAT TATCGTCGAT CCGTCCGATT ACGGTCGTGT GTTGAGCGAA 
GTAGAAGCGG GCGGCATTGA AGCGCAGACC CGTTTCGAGC TGGCCGTGCG TGCTTTCGAA 
CACACCGCGC ATTACGACGG CATGATCGCC GATTATTTTG GCAAGATGGT CAGCGGCAAT 
GCCTTCGCGC CGACCTTCAA CCTGCAATTG AAAAAAGCGC AGGATTTGCG CTACGGCGAG 
AACCCGCATC AGGAAGCCGC GTTTTACGTG GAACATACCC CGCCGGTCGG CAGCATCGCC 
GCCGCGCACA TGATTCAGGG CAAGGCATTG TCGTACAACA ATATTGCCGA CTCCGACGCG 
GCGCTTGAAT GCGTGAAGCA GTTTGCCGAA CCGGCCTGTG TGATCGTCAA GCATGCCAAC 
CCCTGCGGCG TGGCCGTGGC GGAAGACCTG ACCGTGGCGT ACGACCGTGC CTATGCGACC 
GACCCGACCT CCGCCTTCGG CGGCATTATT GCCTTCAACC GCCCATTGGA CGGTCACACC 
GCGCGCACCA TCGTCGAGCG GCAGTTCGTC GAAGTGGTCA TCGCGCCGGA AATTTCACCC 
GAAGCACGCA TCGAGTTCGA AGCCAAACCG AACGTGCGCG TGTTGACTGT CGGTCAATGG 
CCAGCGGTGA GTCCGGCCCG GTTGGACTTC AAGCGTGTGC ATGGCGGCCT GCTGGTGCAG 
GATGACGACG CGGCGCGCAT CACGGCGCGG GATCTGACGG TTGTCTCGGA GCGCCAGCCG 
ACCCCTGAGG AGTTGCGTGA TCTGCTCTTT GCCTGGCAGG TGGCCAAGTT CGTGAAATCC 
AACGCCATCA TTTACGCCAG TGGCGAGCAG ACGATCGGCG TAGGTGCCGG TCAGATGAGC 
CGCGTTTATT CAGCGCGTAT CGCGGCAATC AAGGCCGAAG ACGCCTGCCT GCCGGTCGCC 
GGTTCCGTGA TGGCTTCCGA TGCCTTCTTC CCGTTCCGTG ACGGGATTGA TGCGGCGGCG 
GCCGTTGGCA TCCGTGCGGT TATTCAACCC GGCGGATCGA TGCGCGATCA GGAAGTGATC 
GATGCGGCCA ACGAACACGG TATTGCCATG GTCTTTACCG GCATACGCCA TTTCCGTCAC 
TGA

Protein sequence

MKNNRTTPRR ALLSVSDKTG LLAFAQSLNR HGVALISTGG TASMLRDAGL PVTEVADVTG 
FPEMMAGRVK TLNPKIHGGI LARRGVDEDV MAEHGIEPID IVVVNLYPFA ETVAKPNCQF 
DDAVENIDIG GPAMVRAAAK NHQDVAIIVD PSDYGRVLSE VEAGGIEAQT RFELAVRAFE 
HTAHYDGMIA DYFGKMVSGN AFAPTFNLQL KKAQDLRYGE NPHQEAAFYV EHTPPVGSIA 
AAHMIQGKAL SYNNIADSDA ALECVKQFAE PACVIVKHAN PCGVAVAEDL TVAYDRAYAT 
DPTSAFGGII AFNRPLDGHT ARTIVERQFV EVVIAPEISP EARIEFEAKP NVRVLTVGQW 
PAVSPARLDF KRVHGGLLVQ DDDAARITAR DLTVVSERQP TPEELRDLLF AWQVAKFVKS 
NAIIYASGEQ TIGVGAGQMS RVYSARIAAI KAEDACLPVA GSVMASDAFF PFRDGIDAAA 
AVGIRAVIQP GGSMRDQEVI DAANEHGIAM VFTGIRHFRH