Gene lpl0502 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	lpl0502
Symbol	purH
ID	3115650
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Legionella pneumophila str. Lens
Kingdom	Bacteria
Replicon accession	NC_006369
Strand	-
Start bp	548705
End bp	550294
Gene Length	1590 bp
Protein Length	529 aa
Translation table	11
GC content	40%
IMG OID	637582278
Product	bifunctional phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase
Protein accession	YP_125868
Protein GI	54293453
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0138] AICAR transformylase/IMP cyclohydrolase PurH (only IMP cyclohydrolase domain in Aful)
TIGRFAM ID	[TIGR00355] phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGAAAA AACAAATTTA CTCTTCTTTC AAGCCACGAC GAGCACTACT GAGTGTTTCC 
GATAAAAGAG GAATAAGAGA ACTCGGTCAG GCCTTACATG AACAAGGAGT GGAATTGATA 
GCCACTGGAA ACACAGCTGC GATCTTAAGG GAACATAAAT TACCAGTTAC CGATGTCAGT 
GAGTGCACGG GATTTCCCGA AATAATGGAT GGAAGAGTCA AAACCCTTCA TCCGGCCATT 
CATGCTGGTT TATTAGCCCG CGGAGAACAA GACAGCCCGG TTTTAAGACA ACATGGAATA 
AAACCTATTG ATTTACTGAT TGTCAATTTA TACCCCTTTG AACAAGTCAT TAACCACCCT 
GACTGCGATT TTAATAAGGC CATTGAAAAC ATTGACATTG GTGGACCAGC AATGGTGCGA 
GCGGCAGCTA AAAATCATGC CCACACGCAT GTCATAGTTG ATCCAAACGA TTACTCAAAA 
TTAATTCATT ATTTACAAGA TCAGAAAGTA CCTTCCCATT GGAATTTTGC GTTAGCTAAA 
AAAGCATTTG CCCATACTGC AGCCTATGAT GCCGCAATTG CAAATTATTT AACCACTTTG 
GATAATGATT ATGTCCCAAC TGGATTTCCC GACATACTAA CCTGCCAATT TAGTAAAGTT 
ACTGATCTTC GTTACGGTGA AAACCCCCAT CAGCAAGCTA TTTTTTATGC TGATAAAAAT 
TCACATCCAG GCTCTCTAAG TACAGCAACC TTATTACAGG GAAAACAATT ATCCTATAAT 
AATATTCTTG ATGCCGATGC AGCTCTCGAT TGTGTGAAAT CATTTTCCAA TGAAAAGTCG 
GTTTGCGTCA TTGTAAAACA TACCAACCCC TGTGGCATTG CGTTATCCGA CACATCACTT 
GATGCTTACT TAAAAGCCTT TCAAAGTGAT CCGATATCCG CTTATGGTGG AATTATTGCT 
TTCAATGGAA CTCTGGATAG CGATACGGCA AAAGCAATAT TAGAAAAACA ATTTGTTGAA 
GTGATTATTG CACCTGATGC CAATGAAGAA GCAAAAAAAA TTCTGGCAGC CAAAGAGAAT 
ATTCGTGTTC TTCTAACCGG TTTTTGGCAA CAAGGTAATA ATTTTAGATT AAGTATGAAG 
AAAGTCGATG GTGGTCTATT AGTACAAGAA CACGATTCTC TTTCTCTGGA GTCATGTGAG 
CTACAAACTG TTACCCAGAT AAAACCCACT GATAAACAAC TACAAAATTT AATGTTCGCC 
TGGTTAGCAG CCAAGCATGT CAAATCCAAT GCCATTGTAT ACGCTAATGA TTTGGCCACT 
ATAGGGATTG GTGGAGGACA AACCAGTCGA GTAATGAGTG CTCGTATTGG TTTGTGGCAA 
GCAGAGCAAA TGGGGTTTGA TCCCAAAGGC GCTGTTATGG CCTCAGACGC ATTTATCCCT 
TTCCCTGATA CTATTGAAAT AGCTGCGAAG GCTGGTATAT CCGCAATTAT TCAACCAGGG 
GGTTCTATCA GAGATGAAAA AATTATTTCT TGTGCCGACC AACACAACAT AGCGATGATT 
TTTACAGGAG TGCGACATTT TAAACATTAA

Protein sequence

MAKKQIYSSF KPRRALLSVS DKRGIRELGQ ALHEQGVELI ATGNTAAILR EHKLPVTDVS 
ECTGFPEIMD GRVKTLHPAI HAGLLARGEQ DSPVLRQHGI KPIDLLIVNL YPFEQVINHP 
DCDFNKAIEN IDIGGPAMVR AAAKNHAHTH VIVDPNDYSK LIHYLQDQKV PSHWNFALAK 
KAFAHTAAYD AAIANYLTTL DNDYVPTGFP DILTCQFSKV TDLRYGENPH QQAIFYADKN 
SHPGSLSTAT LLQGKQLSYN NILDADAALD CVKSFSNEKS VCVIVKHTNP CGIALSDTSL 
DAYLKAFQSD PISAYGGIIA FNGTLDSDTA KAILEKQFVE VIIAPDANEE AKKILAAKEN 
IRVLLTGFWQ QGNNFRLSMK KVDGGLLVQE HDSLSLESCE LQTVTQIKPT DKQLQNLMFA 
WLAAKHVKSN AIVYANDLAT IGIGGGQTSR VMSARIGLWQ AEQMGFDPKG AVMASDAFIP 
FPDTIEIAAK AGISAIIQPG GSIRDEKIIS CADQHNIAMI FTGVRHFKH