Gene lpp0019 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	lpp0019
Symbol
ID	3117166
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Legionella pneumophila str. Paris
Kingdom	Bacteria
Replicon accession	NC_006368
Strand	+
Start bp	23666
End bp	25342
Gene Length	1677 bp
Protein Length	558 aa
Translation table	11
GC content	37%
IMG OID	637578719
Product	hypothetical protein
Protein accession	YP_122371
Protein GI	54296002
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3227] Zinc metalloprotease (elastase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTAAAAA AAATAATGTT TTTTATTTTG TCGATATCTA CTTCAAGTAT TTTTGCTGCT 
GACAATGTAG ATTTGTATCA AGCCCCTCTC AATAGCATCA ATAAATACCC TATACTACAA 
ACACCAAAGA ATGCGATTAT TTTAAAGAGT TCTTCTGCCG TTATTGATAA TTCATTGCAA 
AAATTAAATC AAACAAAAGA AGATAATCAA ATGATTGTTC GTTATCAGCA ACTGTATAAA 
GGAATACCTG TTATTGGCGC CCAAGTGATG ATTACTAAAG GAACAGACTC AGGAGTGCAG 
TCCAATGACA ATGCAGAGGT GAACGGCCAT TTATTGGATA ATATAGAACT TAATACGAAA 
CCGGCTATTA GTGCGCAACA AGCGAAGGAA TATGCAAAAA AATCCTATTT TCAATTTAGC 
CCCCAATCTA ACATACAACA GGAAACAGCT GAATTACAGA TTCGGCCAGA CCATAATAAT 
CAATTAAAGC TGGTTTATTT GGTTTCATTT AAAAGCGTGC AACAGGATGG TAAACCAGAC 
TGGCCTTTTT TTGTTATTGA TGCTCAAACA GGAGCTTTGA TTAAGCAATG GAACAATATC 
AAAAATTATT TGGATACAGG GCCTGGAGGC AATGAGAAAG TTCAGGAATA TTGGTATGGT 
AAAGATGGAT TGCCTGCTTT GGATGTGACT CAAAATGGCA GCCAATGCGT CATGGAAAAC 
TCAAAAGTCA AGTTGGTTAA TCTCCATTCT CAATGGGATT GGGAAAACAC GATAAATACT 
CCTTTTGAAT ACGTTTGTAA CAATAATATA GAAGAGAATA TTAATGGAGG ATTTTCTCCT 
GGTAATGATG CGTATTATTT CGGACATGTT ATTGTTGATA TGTACAAAGA CTGGTATGGA 
CTTAATGCCT TACAACATTC TAATGGTGCT CCAATGCAAT TGGTTATGCG AGTTCATTTT 
GGGCAAAACT ATGATAATGC TTTTTGGGAT GGACAAGCTA TGTCATTTGG AGATGGGTTG 
GATTTTTACC CATTGGTTTC TTTAGATGTA GCCGGTCATG AAGTGACTCA TGGTTTTACA 
GAGCAGCATT CTGGTCTTGA GTATCATGAT CAATCAGGTG CACTTAATGA GTCCCTATCT 
GATATGGCAG GACAAGCGTC AAGAGCTTAT CTTTTGGAAA AAAATCCTCA GTTGTATAAC 
AAAGCTTACT TACAGCCCAA TGAAGTCACA TGGGGTATTG GAGAAACAAT AGTTCGTGAT 
TCTTATGGCA AAGCTTTGCG ATTCATGGAT TACCCATCCT CTGATGGAAG CTCCGCAGAT 
TGTTTAGACA AAGGTATTGC GCAAAACAAT GGCAGCTATT GTGCTATCAA TTATGATGAG 
GTAGTAGCCT ATGCCAATGC ACATATCGCA CTTCCTCAAG AACGCCAGAG CTTCATAGTT 
CATACAGCCA GTGGTGTGTT CAATAAGGCT TTTTACTTAA TGTCTAAGGA TATGGGTATT 
AAAAACGCTT ATCACATCAT GGTTGTTGCT AACACAAAAT ATTGGACTCC TACGACAGAC 
TTTAAAAATG GAGCTTGCGG AGTCATTTAT GCTGCCAGGG ATTTAAATAC TGATATCAAT 
AAGGTTAAGT CTGCTTTTGG TCAAGTAGGT ATTGATATAG CCGGGTGTGC TATTTAG

Protein sequence

MLKKIMFFIL SISTSSIFAA DNVDLYQAPL NSINKYPILQ TPKNAIILKS SSAVIDNSLQ 
KLNQTKEDNQ MIVRYQQLYK GIPVIGAQVM ITKGTDSGVQ SNDNAEVNGH LLDNIELNTK 
PAISAQQAKE YAKKSYFQFS PQSNIQQETA ELQIRPDHNN QLKLVYLVSF KSVQQDGKPD 
WPFFVIDAQT GALIKQWNNI KNYLDTGPGG NEKVQEYWYG KDGLPALDVT QNGSQCVMEN 
SKVKLVNLHS QWDWENTINT PFEYVCNNNI EENINGGFSP GNDAYYFGHV IVDMYKDWYG 
LNALQHSNGA PMQLVMRVHF GQNYDNAFWD GQAMSFGDGL DFYPLVSLDV AGHEVTHGFT 
EQHSGLEYHD QSGALNESLS DMAGQASRAY LLEKNPQLYN KAYLQPNEVT WGIGETIVRD 
SYGKALRFMD YPSSDGSSAD CLDKGIAQNN GSYCAINYDE VVAYANAHIA LPQERQSFIV 
HTASGVFNKA FYLMSKDMGI KNAYHIMVVA NTKYWTPTTD FKNGACGVIY AARDLNTDIN 
KVKSAFGQVG IDIAGCAI