Gene HMPREF0424_1033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HMPREF0424_1033
Symbol	purM
ID	8709867
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gardnerella vaginalis 409-05
Kingdom	Bacteria
Replicon accession	NC_013721
Strand	+
Start bp	1172277
End bp	1173311
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	44%
IMG OID	646483126
Product	phosphoribosylformylglycinamidine cyclo-ligase
Protein accession	YP_003374238
Protein GI	283783484
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0150] Phosphoribosylaminoimidazole (AIR) synthetase
TIGRFAM ID	[TIGR00878] phosphoribosylaminoimidazole synthetase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCACATG CATATGAAGA AGCTGGCGTA AGCGTAGAAG CAGGATACGA AGTAGTACGT 
CGTATTAAAT CTCATGTAAA TCGCACAAAG CGCCCAGGCG TTGTAGGTGG CATTGGCGGA 
TTTGGCGGCT TATTTGATTT GGCGTCTCTT GGTTACAAAG AGCCAGTGCT GATTTCTGGC 
ACGGATGGCG TTGGAACCAA GCTTGTGATT GCAAAAATGA TGAATAAGCA TAACACTATT 
GGCATTGATT GCGTTGCAAT GTGCGTAAAC GATATTGCAG CTCAAGGTGC CGAGCCGCTT 
TTCTTCCTCG ATTATATTGC ATGCGGAAAA AACAATCCTG AAATACTTGA GCAAGTAGTT 
TCAGGCGTTG CAGACGGTTG CGTGCAATCA GAAGCAGGTT TAATTGGCGG CGAAACTGCT 
GAAATGCCTG GAATGTATGA CGAAGACGAG TACGATCTTG CAGGTTTTGC AGTAGGCGTT 
GCAGAACGTT CTAATATTGT TGATGGATCC ACTATTACTG CCGGCGACGT GCTTATCGGA 
CTTCCTTCTT CAGGAGTTCA TTCAAACGGA TTCTCTCTTG TTCGCAAAGC TTTGTTTGAA 
GAAGCAGGTT TTAGCGTTGA CACCAAGCTA GATGAGCTTA ATGGCAAAAC ACTTGGCGAA 
GTTCTTCTTG AACCCACTCG AATCTACGTA AAAGCTTTAA AGCCACTTTT TGCTGAACAT 
CTTATTAAGG GAGTTGCTCA TATTACAGGC GGCGGATTTA TTGAAAATGT TCCGCGCATG 
TACGCAGATG ATTTAGCTGC AAAAATTGAT ACCACTAGCT GGAGCGTTCC ACCTATTTTT 
GGCGTTATTG AACAAGCAGG CAAAGTTGCT CACGCTGAAA TGTTCAACGT TTTTAATATG 
GGCATTGGCA TGGTTTTGGC AGTTGATGAA AGCCGAGCAA ACGAGGCAAT GCGAGTACTA 
AACAAGCATG ACGAAACCGC TTATATTATT GGCAAAATGG CTAAGCGAGA AAACGTTGCA 
GTTGAGTTGT TGTAA

Protein sequence

MPHAYEEAGV SVEAGYEVVR RIKSHVNRTK RPGVVGGIGG FGGLFDLASL GYKEPVLISG 
TDGVGTKLVI AKMMNKHNTI GIDCVAMCVN DIAAQGAEPL FFLDYIACGK NNPEILEQVV 
SGVADGCVQS EAGLIGGETA EMPGMYDEDE YDLAGFAVGV AERSNIVDGS TITAGDVLIG 
LPSSGVHSNG FSLVRKALFE EAGFSVDTKL DELNGKTLGE VLLEPTRIYV KALKPLFAEH 
LIKGVAHITG GGFIENVPRM YADDLAAKID TTSWSVPPIF GVIEQAGKVA HAEMFNVFNM 
GIGMVLAVDE SRANEAMRVL NKHDETAYII GKMAKRENVA VELL