Gene Smal_3662 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smal_3662
Symbol	purH
ID	6474542
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Stenotrophomonas maltophilia R551-3
Kingdom	Bacteria
Replicon accession	NC_011071
Strand	+
Start bp	4120617
End bp	4122200
Gene Length	1584 bp
Protein Length	527 aa
Translation table	11
GC content	67%
IMG OID	642732861
Product	bifunctional phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase
Protein accession	YP_002030044
Protein GI	194367434
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0138] AICAR transformylase/IMP cyclohydrolase PurH (only IMP cyclohydrolase domain in Aful)
TIGRFAM ID	[TIGR00355] phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	0.892797
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGCTG ATCTGTTGCC CGTCCGCCGG GCCCTCCTCT CCGTTTCCGA CAAGACCGGT 
CTGGTCGAGC TGGCCACTGC GCTGGCGGCA CGCGGCGTGG AGCTGCTGTC CACCGGCGGC 
ACCGCCAAGG CGATCCGCGA TGCGGGCCTG GCCGTGAAGG ACGTGGCCGA CGTCACCGGC 
TTCCCGGAAA TGATGGACGG CCGGGTCAAG ACCCTGCACC CGATGGTGCA TGGCGGCCTG 
CTGGGCCGTT CGGGCCTGGA TGATGCGGTC ATGGCCGAGC ACGGCATCGG TGCCATCGAC 
CTGCTGGTGC TGAACCTGTA CCCGTTCGAG TCGGTCACCG CCAAGGCCGA CTGCAGCCTG 
GCCGACGCGG TCGAGAACAT CGACATCGGC GGCCCGGCCA TGCTGCGTTC GGCGGCCAAG 
AACTTCGCCC GCGTGGCAGT GGCCACCGAC CCGTCGCAGT ACGCCGAACT GCTGGCCTCG 
CTGGAGGCCA ACAACGGCCA GCTGACGGCC GCCACCCGCT TCGCGTTCTC GGTGGCCGCG 
TTCAACCGCG TCGCCCAGTA CGACGCCGCG ATCAGCAACT ACCTGTCGGC GGTCACCGCT 
ACTGACACGG CGGTGCCGGT GCGTGCCGAG TACCCGGCAC AGATGAATTC CACCTTCGTG 
AAGGTGATGG ACCTGCGCTA CGGCGAAAAC CCGCACCAGA GCGGCGCGTT CTACCGCGAC 
CTGTACCCGG TGCCGGGCAC GCTGGCCACC TTCCAGCAGC TGCAGGGCAA GGAGCTGAGC 
TACAACAACC TGGCCGATGC CGATGCGGCG TGGGAATGCG TGCGCCAGTT CGACGCGCCG 
GCCTGTGTCA TCGTCAAGCA CGCCAACCCG TGCGGCGTGG CCGTCGGTGC CGGCAACGGC 
GATGCCTATG AGCTGGCCTA CGCCACCGAC CCCACCAGTG CCTTCGGCGG CATCATCGCC 
TTCAACAAGC CGCTGGATGC AGCCACCGCC AAGGTGATCC TGGACCGCCA GTTCGTCGAA 
GTGCTGATCG CTCCGGACTA CGAGCCGGCC GCGCTGGAAT ACGCGCAGAA GAAGGCCAAC 
GTGCGCGTGC TGCGCATCCC GCACGGCGAC GGCCTGAACA ACTTCGACAA CAAGCGCGTG 
GGTTCCGGCC TGCTGCTGCA GTCCTCGGAC AACCGCGGCA TGACCCGCGA CGAACTGAAG 
GTGGTCAGCA AGCTGGCGCC GACCGACAAG CAGTTCACCG ATCTGCTGTT TGCCTGGAAG 
GTCGCCAAGT TCGTGAAGTC CAACGCGATC GTCTATGCCA AGGACAACCG CACCATCGGT 
GTCGGCGCCG GCCAGATGAG CCGCGTGTAC TCGGCCCGCA TCGCCGGCAT CAAGGCAGCC 
GACGCGAACC TGGTGGTGGA AGGTTCGGTG ATGGCCTCCG ATGCGTTCTT CCCGTTCCGC 
GACGGCATCG ATGCCGCGGC TGCTGCCGGC ATCAAGGCGG TGATCCAGCC GGGCGGTTCG 
ATGCGCGATG CCGAAGTGAT CGCCGCCGCC GACGAACATG GCCTGGCCAT GGTGTTCACC 
GGCGTGCGCC ACTTCCGCCA TTGA

Protein sequence

MTADLLPVRR ALLSVSDKTG LVELATALAA RGVELLSTGG TAKAIRDAGL AVKDVADVTG 
FPEMMDGRVK TLHPMVHGGL LGRSGLDDAV MAEHGIGAID LLVLNLYPFE SVTAKADCSL 
ADAVENIDIG GPAMLRSAAK NFARVAVATD PSQYAELLAS LEANNGQLTA ATRFAFSVAA 
FNRVAQYDAA ISNYLSAVTA TDTAVPVRAE YPAQMNSTFV KVMDLRYGEN PHQSGAFYRD 
LYPVPGTLAT FQQLQGKELS YNNLADADAA WECVRQFDAP ACVIVKHANP CGVAVGAGNG 
DAYELAYATD PTSAFGGIIA FNKPLDAATA KVILDRQFVE VLIAPDYEPA ALEYAQKKAN 
VRVLRIPHGD GLNNFDNKRV GSGLLLQSSD NRGMTRDELK VVSKLAPTDK QFTDLLFAWK 
VAKFVKSNAI VYAKDNRTIG VGAGQMSRVY SARIAGIKAA DANLVVEGSV MASDAFFPFR 
DGIDAAAAAG IKAVIQPGGS MRDAEVIAAA DEHGLAMVFT GVRHFRH