Gene lpl2204 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	lpl2204
Symbol	lly
ID	3114280
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Legionella pneumophila str. Lens
Kingdom	Bacteria
Replicon accession	NC_006369
Strand	+
Start bp	2518550
End bp	2519596
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	41%
IMG OID	637583978
Product	4-hydroxyphenylpyruvate dioxygenase (legiolysin)
Protein accession	YP_127539
Protein GI	54295124
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG3185] 4-hydroxyphenylpyruvate dioxygenase and related hemolysins
TIGRFAM ID	[TIGR01263] 4-hydroxyphenylpyruvate dioxygenase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAAATA ATAACCCCTG CGGATTAGAT GGCTTTGCCT TTTTAGAGTT TTCAGGCCCT 
GATAGGAATA AATTACATCA GCAATTTTCT GAGATGGGGT TTCAGGCCGT TGCCCACCAT 
AAAAATCAAG ACATTACTCT TTTCAAACAA GGGGAAATAC AATTTATAGT GAATGCGGCC 
TCCCATTGTC AGGCAGAAGC GCATGCTTCA ACTCATGGTC CAGGCGCTTG TGCAATGGGC 
TTTAAAGTAA AAGATGCCAA AGCCGCTTTT CAACACGCTA TCGCGCATGG CGGTATAGCA 
TTTCAGGATG CGCCTCATGC CAATCACGGC TTGCCAGCCA TCCAGGCTAT TGGTGGTAGT 
GTTATTTATT TTGTCGATGA AGAACACCAA CCCTTCTCTC ATGAATGGAA TATTACCTCG 
CCAGAACCCG TAGTTGGAAA TGGTCTGACC GCAATCGACC ATCTCACCCA TAACGTTTAT 
CGCGGTAATA TGGATAAATG GGCCAGTTTC TATGCTTCCA TTTTTAACTT CCAGGAAATT 
CGTTTTTTCA ATATCAAAGG AAAAATGACT GGTTTGGTCA GTCGAGCATT AGGTAGCCCT 
TGTGGCAAAA TCAAAATTCC TTTAAACGAA TCCAAAGATG ATTTATCACA AATTGAAGAG 
TTTCTTCATG AATATCATGG CGAGGGCATT CAACACATCG CTCTCAATAC CAATGATATT 
TATAAAACAG TCAACGGCTT AAGAAAACAA GGGGTCAAAT TCCTGGATGT GCCGGATACT 
TACTATGAGA TGATTAATGA CCGTCTCCCA TGGCACAAGG AGCCACTGAA TCAACTCCAT 
GCTGAGAAAA TTTTAATTGA TGGAGAAGCA GATCCCAAAG ACGGCTTGTT ACTGCAAATA 
TTTACTGAAA ACATATTTGG ACCAGTCTTT TTTGAAATTA TTCAACGCAA AGGCAATCAG 
GGGTTTGGTG AAGGGAATTT CCAGGCTCTA TTCGAAGCTA TTGAAAGAGA TCAAGTTCGA 
CGTGGTACTT TAAAAGAATT AAGCTAG

Protein sequence

MQNNNPCGLD GFAFLEFSGP DRNKLHQQFS EMGFQAVAHH KNQDITLFKQ GEIQFIVNAA 
SHCQAEAHAS THGPGACAMG FKVKDAKAAF QHAIAHGGIA FQDAPHANHG LPAIQAIGGS 
VIYFVDEEHQ PFSHEWNITS PEPVVGNGLT AIDHLTHNVY RGNMDKWASF YASIFNFQEI 
RFFNIKGKMT GLVSRALGSP CGKIKIPLNE SKDDLSQIEE FLHEYHGEGI QHIALNTNDI 
YKTVNGLRKQ GVKFLDVPDT YYEMINDRLP WHKEPLNQLH AEKILIDGEA DPKDGLLLQI 
FTENIFGPVF FEIIQRKGNQ GFGEGNFQAL FEAIERDQVR RGTLKELS