Gene lpp1248 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	lpp1248
Symbol	hmgA
ID	3117133
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Legionella pneumophila str. Paris
Kingdom	Bacteria
Replicon accession	NC_006368
Strand	-
Start bp	1385487
End bp	1386737
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	40%
IMG OID	637579942
Product	homogentisate 1,2-dioxygenase
Protein accession	YP_123572
Protein GI	54297203
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3508] Homogentisate 1,2-dioxygenase
TIGRFAM ID	[TIGR01015] homogentisate 1,2-dioxygenase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTATTTGC AAGGATTTGG TAATTATCAC CACAGCGAGG CTGTTAAAGG AGCATTACCC 
ACAAATCAAA ACTCACCGCA GCACTGTAGC TTAGGACTTT ACGCAGAGCA ATTGAGTGGA 
ACCTCGTTCA CCCGTCCCCG GCATAATAAT CTTCGAAGTT GGCTATATAG AATACTTCCT 
ACTGTTACCC AGGGAACGTA TTACCCCTAT GAGTTTAATG TTATGCAACC TTTTGTTGAT 
GAGTTGTCAC CCAATGCCAT GCGTTGGTCA CCTCTTTATA ACAGCTCTCA AATTAAATGT 
GATTTTGTTG AAGGACTATT TCATATTGCC GGTAGCCCGT TAGTTAATAC CTATACTTAT 
TATTGCAACC ACTCCATGAG CGATAAATAT TTCGCCAATA ATGATGGTGA GTTATTATTT 
GTTCCCTATG CAGGCGAGAT TCATCTGCAT ACTGAATTTG GCAAATTAAT ACTATCTTCC 
GGATCGATCG CAGTGATACC TCGTGGCGTT AAATTTAAAG TGGAAGTAAT CAGCAAGGAG 
GCAAAAGGTT ATCTTTGTGA AAATAGCGGA AATCCCTTAA CCTTACCTCA GTTAGGCCCC 
ATTGGAGCCA ATGGTTTGGC AAACCCAAGA CATTTTCAAT ATCCAGTAGC CGCATTTGAA 
AACTCTGGTG GCGAGCATAC TATAATCTGT AAAAACCAGA AAAAATTATG GTTTACTGTA 
TGCAACCACT CTCCTTTAAA TGTCGTCGCC TGGCATGGCA ATTATGCACC ATATTGTTAT 
GATCTCAGTT TGTTCAATAC AATTAACACA GTCAGTTTTG ATCACCCTGA TCCTTCCATA 
TTCACTGTAT TAACTTCAGA AAGCGAAATA CCCGGTGTTT CTAACTTGGA CTTTGTTATT 
TTCCCACCTC GCTGGATGGT TGCCGAACAT ACTTTTAGAC CGCCCTATTT TCATAGAAAC 
TACATGAATG AACTGATGGG ACTTGTCTAT GGTGAATATG ATGCCAAGAA GGAAGGATTC 
ATACCGGGTG GTATCAGCAT CCATAATTGC ATGACTCCAC ACGGACCTGA TTATGAATCT 
TACGAAATTG CAGCGTCGCA GGATCTAAAA CCAAATTATA TCAACTCCCT CGCCTTTATG 
TTTGAAACCA AAGACTACTG GCAAGTAACT GAGCAAGCTT ATCGGCATCC CAGCAGACAA 
ATGGATTACC TTAATTGTTG GCAAGGCTTT AAAATAGAGT TTAGTCAATA A

Protein sequence

MYLQGFGNYH HSEAVKGALP TNQNSPQHCS LGLYAEQLSG TSFTRPRHNN LRSWLYRILP 
TVTQGTYYPY EFNVMQPFVD ELSPNAMRWS PLYNSSQIKC DFVEGLFHIA GSPLVNTYTY 
YCNHSMSDKY FANNDGELLF VPYAGEIHLH TEFGKLILSS GSIAVIPRGV KFKVEVISKE 
AKGYLCENSG NPLTLPQLGP IGANGLANPR HFQYPVAAFE NSGGEHTIIC KNQKKLWFTV 
CNHSPLNVVA WHGNYAPYCY DLSLFNTINT VSFDHPDPSI FTVLTSESEI PGVSNLDFVI 
FPPRWMVAEH TFRPPYFHRN YMNELMGLVY GEYDAKKEGF IPGGISIHNC MTPHGPDYES 
YEIAASQDLK PNYINSLAFM FETKDYWQVT EQAYRHPSRQ MDYLNCWQGF KIEFSQ