Gene lpl1248 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	lpl1248
Symbol	hmgA
ID	3114748
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Legionella pneumophila str. Lens
Kingdom	Bacteria
Replicon accession	NC_006369
Strand	-
Start bp	1391232
End bp	1392482
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	40%
IMG OID	637583021
Product	homogentisate 1,2-dioxygenase
Protein accession	YP_126599
Protein GI	54294184
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3508] Homogentisate 1,2-dioxygenase
TIGRFAM ID	[TIGR01015] homogentisate 1,2-dioxygenase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTATTTGC AAGGATTTGG TAATTATCAC CACAGCGAGG CTGTTAAAGG AGCATTACCC 
CCAAATCAAA ACTCACCTCA ACACTGTAGC TTAGGACTTT ACGCAGAGCA ATTGAGTGGA 
ACCTCGTTCA CCCGTCCCCG ACATAATAAT CTTCGAAGTT GGCTATATAG AATACTTCCT 
ACTGTTACCC AGGGCACGTA TTACCCCTAT GAGTTTAATA TTATGCAACC TTTAGTTGAT 
GAGTTGTCAC CCAATGCCAT GCGTTGGTCA CCTCTTTATA ACAGCTCTCA AATTAAATGT 
GATTTTGTTG AAGGACTATT TCATATTGCC GGTAGCCCGT TAGTTAATGC CTATACTTAT 
TATTGCAACC ACTCCATGAG CGATAAATAT TTCGCCAATA ATGATGGTGA GTTATTATTT 
GTTCCCTATA CAGGCGAGAT TCATCTGCAT ACTGAATTTG GCAAATTAAT GCTCTCTTCT 
GGATCGATCG CAGTGATACC TCGTGGCGTT AAATTTAAAG TGGAAGTAAT CAGCAAGGAG 
GCAAAAGGTT ATCTTTGTGA AAATAGCGGA AATCCCTTAA CCTTACCTCA GTTAGGCCCC 
ATTGGAGCCA ATGGTTTGGC AAACCCAAGA CATTTTCAAT ATCCAGTAGC CGCATTTGAA 
AACTCTGTAG GCGAGCATAC TATAATCTGT AAAAACCAGA AAAAATTATG GTTTACTGTA 
TGCAACCACT CTCCTTTAAA TGTCGTCGCC TGGCATGGCA ATTATGCACC ATATTGTTAT 
GATCTCAGTT TGTTCAATAC AATTAACACA GTCAGTTTTG ATCATCCTGA TCCTTCCATA 
TTCACTGTAT TAACTTCAGA AAGCGAAATA CCCGGTGTTT CTAACTTGGA CTTTGTTATT 
TTCCCACCTC GCTGGATGGT TGCCGAACAT ACTTTTAGAC CGCCTTATTT TCATAGAAAC 
TACATGAATG AACTGATGGG ACTTGTCTAT GGTGAATATG ACGCCAAGAA GGAAGGATTC 
ATACCGGGCG GTATCAGCAT CCATAATTGC ATGACTCCAC ACGGACCTGA TTATGAATCT 
TATGAAATTG CAGCGTCGCA GGATCTAAAA CCAAATTATA TCAACTCCCT GGCCTTTATG 
TTTGAAACCA AAGACTACTG GCAAGTAACT GAGCAAGCTT ATCGACATCC CAGCAGACAA 
ATAGATTATC TTAATTGTTG GCAAGGCTTT AAAATAGAGT TTAGTCAATA A

Protein sequence

MYLQGFGNYH HSEAVKGALP PNQNSPQHCS LGLYAEQLSG TSFTRPRHNN LRSWLYRILP 
TVTQGTYYPY EFNIMQPLVD ELSPNAMRWS PLYNSSQIKC DFVEGLFHIA GSPLVNAYTY 
YCNHSMSDKY FANNDGELLF VPYTGEIHLH TEFGKLMLSS GSIAVIPRGV KFKVEVISKE 
AKGYLCENSG NPLTLPQLGP IGANGLANPR HFQYPVAAFE NSVGEHTIIC KNQKKLWFTV 
CNHSPLNVVA WHGNYAPYCY DLSLFNTINT VSFDHPDPSI FTVLTSESEI PGVSNLDFVI 
FPPRWMVAEH TFRPPYFHRN YMNELMGLVY GEYDAKKEGF IPGGISIHNC MTPHGPDYES 
YEIAASQDLK PNYINSLAFM FETKDYWQVT EQAYRHPSRQ IDYLNCWQGF KIEFSQ