Gene Meso_3420 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Meso_3420
Symbol	purH
ID	4183118
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chelativorans sp. BNC1
Kingdom	Bacteria
Replicon accession	NC_008254
Strand	+
Start bp	3696173
End bp	3697786
Gene Length	1614 bp
Protein Length	537 aa
Translation table	11
GC content	62%
IMG OID	638069314
Product	bifunctional phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase
Protein accession	YP_675956
Protein GI	110635748
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0138] AICAR transformylase/IMP cyclohydrolase PurH (only IMP cyclohydrolase domain in Aful)
TIGRFAM ID	[TIGR00355] phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.580754
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGTTT CCGCGAAGAA TATTCCGGCG CCCGATCTCG TTCCTGTGCG GCGCGCGCTC 
ATATCCGTCT CTGACAAGAC AGGCATTGTC GATTTCGCCC GCAGTCTGGC TGCCCGGGAA 
GTTGCGCTTG CATCCACCGG CGGCACCGCG GCGCTGCTCG CGCGAAGCGG CATCGGCGTG 
ATGGACGTCT CTCAGCTCAC CGGATTTCCG GAGATCATGG ACGGACGCGT GAAAACGCTT 
CATCCTGCCG TGCACGGCGG CCTCCTCGCC ATCCGTGACG ACCCCGATCA TCGATCCGCA 
ATGGAAACAC ATGCCATCAA GCCAATCGAT CTGGTGGTAA TCAATCTCTA TCCGTTCGAA 
GACGTGCGTT TCGGCGGAGG GGATTATGCG GCGACGGTGG AGAATATAGA CATTGGCGGC 
CCAGCCATGT TGCGCGCTGC AGCCAAGAAC CACGCCTATG TGGCGGTCGT TACCGATCCG 
GCAGATTATG CCCGAGTATT GGAAGCCCTG GAAAAAAACG ATGGCGCGCT CCCCTACCGC 
CTGAGACAGG AACTGGCGGC CAAAGCCTAT GCGCGTACCG CGGCCTATGA CGCGGCAATT 
TCGCAATGGT TTGCAGAATC CCTTGCTATT GCTGAGCCGG AATGGCGCTC CTTTGGCGGC 
AGACTTGCTC AAGTGATGCG CTATGGCGAG AATCCGCACC AGCAGGCAGG CTTTTACGCC 
ACCGGCGAGA AGCGGCCGGG TGTGGCGACG GCGCGCCAGG TACAGGGCAA GCAGCTTTCC 
TACAACAACA TCAACGACAC GGACGCCGCC TTCGAGCTGG TCTGCGAATT CGACCCGAAA 
AAGGTCGCGG CCGTTGCCAT CATCAAGCAC GCCAATCCCT GCGGCGTGGC GGAGGGAACC 
TCACTGGCCG AAGCCTATCG CAAAGCACTT GCCTGTGATC CCGTTTCCGC CTTCGGCGGC 
ATTGTCGCAC TCAATCGCAT TCTGGATGCG GAGGCGGCCG AGGAAATCGC AAAAATTTTC 
ACCGAGGTAA TCATCGCGCC CGACGCGACG GAGGAAGCGC AGGCGATTAT CGCCACCAAG 
AAGAACTTGC GCCTGCTCTT GACGGAAGGG GTAGCCGACC CGCGTGCGCC TGGGCTTTCG 
GCCAAGACCG TAGCGGGCGG GCTGCTCGTC CAGACGCGAG ACAATGGCGT GATCGATGAT 
CTCGATCTCC GGGTGGTCAC CAGGCGTGCG CCGTCCGAGA AGGAAATGGC AAACCTGAAA 
TTCGCCTTCC GCGTCGCCAA GCACGTGAAG TCGAACGCTA TAGTCTACGC GCGGGACCTC 
GCCACGGTGG GCATCGGTGC GGGCCAGATG AGCCGCGTCG ATTCCGCCCG CATCGCCGCG 
CGAAAGGCGG AAGATGCCGC TGCTGCCGCG GGCGGACAGC CGTTGACGAA AGGTTCTGTG 
GTGGCTTCGG ACGCATTCTT CCCCTTTGCC GACGGCCTTC TCTCGGCCGT GGAGGCGGGG 
GCCACAGCGG TTATTCAGCC GGGTGGTTCC ATGCGCGACG ACGAGGTGAT CAAGGCAGCC 
GACGAGCACG GCATCGCCAT GGTCTTCACC GGCATGCGGC ATTTCAGGCA CTGA

Protein sequence

MTVSAKNIPA PDLVPVRRAL ISVSDKTGIV DFARSLAARE VALASTGGTA ALLARSGIGV 
MDVSQLTGFP EIMDGRVKTL HPAVHGGLLA IRDDPDHRSA METHAIKPID LVVINLYPFE 
DVRFGGGDYA ATVENIDIGG PAMLRAAAKN HAYVAVVTDP ADYARVLEAL EKNDGALPYR 
LRQELAAKAY ARTAAYDAAI SQWFAESLAI AEPEWRSFGG RLAQVMRYGE NPHQQAGFYA 
TGEKRPGVAT ARQVQGKQLS YNNINDTDAA FELVCEFDPK KVAAVAIIKH ANPCGVAEGT 
SLAEAYRKAL ACDPVSAFGG IVALNRILDA EAAEEIAKIF TEVIIAPDAT EEAQAIIATK 
KNLRLLLTEG VADPRAPGLS AKTVAGGLLV QTRDNGVIDD LDLRVVTRRA PSEKEMANLK 
FAFRVAKHVK SNAIVYARDL ATVGIGAGQM SRVDSARIAA RKAEDAAAAA GGQPLTKGSV 
VASDAFFPFA DGLLSAVEAG ATAVIQPGGS MRDDEVIKAA DEHGIAMVFT GMRHFRH