Gene Mfla_0349 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mfla_0349
Symbol	purH
ID	3999316
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacillus flagellatus KT
Kingdom	Bacteria
Replicon accession	NC_007947
Strand	-
Start bp	355117
End bp	356703
Gene Length	1587 bp
Protein Length	528 aa
Translation table	11
GC content	59%
IMG OID	637937245
Product	bifunctional phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase
Protein accession	YP_544461
Protein GI	91774705
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0138] AICAR transformylase/IMP cyclohydrolase PurH (only IMP cyclohydrolase domain in Aful)
TIGRFAM ID	[TIGR00355] phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.432083
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGTGA TCAAACGTGC GCTTATCAGT GTCTCTGATA AAACCGGTAT TCTCGAATTT 
GCCAAGGCCC TTGCCGAATT CGGTGTGGAG ATACTCTCTA CCGGCGGTAC AGCAAAGCTG 
TTCCGCGACA ACGGCATTCC CGTCACGGAG GTCAGTGACT ACACCGGCTT CCCGGAAATG 
CTGGACGGAC GCGTCAAGAC GCTGCACCCG AAAATCCACG GTGGCCTGCT TGGTCGCCGC 
GACCTGCCGG AACATGTCAC CGCCATGCAA GCTGCCGGCA TCCCGGATAT CGACATGATC 
GTGGTCAACC TCTACCCGTT CGAAGCGACT GTCGCCCGTC CTGACGCCAC ACTGGAAGAT 
GCGATCGAGA ATATCGACAT CGGCGGGCCC GCCATGGTAC GTTCCGCTGC CAAGAACTGG 
CAGGATGTTG CGGTATTGAC CGATGCCTCC CAATACGAGG AAGTACTGGC CGAGATGCGC 
AGCACTGGTG GCGCTACCAG CAAGGCGACG CGCTTTGCCT TGTCTGTTGC CGCGTTCAAC 
CGCATCAGCA ATTATGACGG CGCCATCAGC GACTACCTTT CCTCCTTTAA TGCAGACGGC 
ACACGCAACG AGTTCCCCGG CCAGATCAAT GGCCGCCTGG TCAAGGTGCA GGATCTGCGC 
TATGGCGAGA ACCCGCATCA GCAGGCAGCG TTCTACCGCG ACCTGTATCC TGCGCCCGGC 
TCGCTCGTGA CTGCCCAACA ATTGCAGGGC AAGGAGCTTT CCTATAACAA TATTGCCGAT 
GCCGACGCGG CATGGGAATG CGTCAAGAGC TTCGACAGCA CGGCCTGCGT CATCGTCAAG 
CACGCCAATC CTTGTGGCGT GGCACTGGGC GCCACACCGC TCGAGGCCTA CCAGAAAGCG 
TTCCAGACCG ATCCGACCTC CGCGTTCGGC GGCATCATTG CCTTCAACCA CACCCTGGAT 
GGCGCAGCAG CAGAGGCCGT TTCCAAGCAG TTCGTCGAAG TGTTGATTGC ACCGGACTAC 
ACCGAGGAAG CCCTGGCAGT ATTCAAGGCC AAGGCCAATG TACGCGTGCT CAAGATCGCC 
TTGCCGGTAG GCGGCGACAG CCCATGGAGC CGAGGCCGCA ACTCCCATGA CACCAAGCGC 
GTCGGTTCCG GCGTACTGAT TCAGACCGCA GATAACCATG AAATCAGCGC GGCCGACATC 
AAGGTCGTCA CCAAGAAGCA ACCGACGCCG GAACAGCTGG AAGATCTGCT GTTTGCCTGG 
CGTGTCGCCA AATACGTAAA ATCCAACGCC ATCGTCTTCT GCGGCAACGG CATGACATTG 
GGTGTGGGCG CTGGCCAGAT GAGCCGCGTC GATAGCACCA GAATTGCCGC GATCAAGGCG 
CAGAACGCCG GCCTGAGCTT GCAAGGCTCC GCTGTGGCGT CCGATGCGTT CTTTCCGTTC 
CGCGACGGCG TGGATGTCCT GGCGGAAGCT GGTGCCAGCT GCGTGATCCA GCCAGGCGGC 
AGCATCCGCG ACGACGAAGT GATTGCGGCG GCGGATGAAC ATGGGTTAGT CATGATATTC 
ACCAATATCC GCCACTTCCG CCATTGA

Protein sequence

MAVIKRALIS VSDKTGILEF AKALAEFGVE ILSTGGTAKL FRDNGIPVTE VSDYTGFPEM 
LDGRVKTLHP KIHGGLLGRR DLPEHVTAMQ AAGIPDIDMI VVNLYPFEAT VARPDATLED 
AIENIDIGGP AMVRSAAKNW QDVAVLTDAS QYEEVLAEMR STGGATSKAT RFALSVAAFN 
RISNYDGAIS DYLSSFNADG TRNEFPGQIN GRLVKVQDLR YGENPHQQAA FYRDLYPAPG 
SLVTAQQLQG KELSYNNIAD ADAAWECVKS FDSTACVIVK HANPCGVALG ATPLEAYQKA 
FQTDPTSAFG GIIAFNHTLD GAAAEAVSKQ FVEVLIAPDY TEEALAVFKA KANVRVLKIA 
LPVGGDSPWS RGRNSHDTKR VGSGVLIQTA DNHEISAADI KVVTKKQPTP EQLEDLLFAW 
RVAKYVKSNA IVFCGNGMTL GVGAGQMSRV DSTRIAAIKA QNAGLSLQGS AVASDAFFPF 
RDGVDVLAEA GASCVIQPGG SIRDDEVIAA ADEHGLVMIF TNIRHFRH