Gene lpp0239 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	lpp0239
Symbol
ID	3118370
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Legionella pneumophila str. Paris
Kingdom	Bacteria
Replicon accession	NC_006368
Strand	+
Start bp	262505
End bp	263653
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	43%
IMG OID	637578931
Product	hypothetical protein
Protein accession	YP_122582
Protein GI	54296213
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAAAA GCCTGATTTT TTTAGCAATA GGTATGTTTA CAGTAGGTTG CAATACCTTT 
CTGATTGCTG GTTTGCTTCC TCAAATAGGC GAAACGCTCG GGCAGCCGGT TGCAGTAACT 
GGGCAAGGAG TGAGTCTATT CAGTTTGACT TATCTTCTCT CAGCGCCACT TTTTTCTCTG 
ATTTTTGTTA ATCAGCCGGT AAAGCGTATG GTTCAGCTTG CGCTTACTGT CTTCATGTTT 
GGCAATTTAA TAACGCTACT TTCTGAAAAT ATCGTGCTGT TTTTAATTGG AAGATCTCTG 
GCGGGAGCAG GAACCGGGAT TTTTACGCCG TTATGTATCA GCATTGCCGT TCATTTTGCC 
AGCCCATCTG CCAAAGGACG AATTTTAAGT TTTATCTGGA GTGCTAACAG TGCGGGTGTA 
GTGTTTGGCG TTCCTGCCGG ACTTTACTTA TCCTCCTTGT TTCATTGGCA GTTATCGATT 
GCCAGTCTTA TTATTTTAAG TTTGCTTGCA TTGATTGGTT TTTCAATGCA AAACATTGAT 
ATAAAACTAC CCAAACCTTC GCCATTTGGA GGCAGGCTTC GTCTTCTGGT CGAGCCAAAA 
ACGCTATCGG TAATTGGAAT TACTTGCTTT ACCGCCTTGG CAAGTTTGGG ACTATACTCG 
TATGTCACCC TGATTCAATC AGGATCCCCT AATTCGCTCA GTATGACGCT ATTGAGTTGG 
GGACTGGGAG GATTTATAGG AAGCTCACTG ATTGGGGTGT TTATCGATCG AACGGGTAAA 
CCACGGGTTA TTATGGCCTT AATTTTGGTT GGCCTCATGT TTGCTCTGAT TGCCATACCA 
TTCACCAGGA ATCTGCCTTA CCTGGGATTA ATCCCTTTTT TTATGTGGGG TGCTTGCGGA 
TGGGCTATAG TGACTCCCCA GCAACACATT TTATATGAAT TACATGAAAA TCAGGGAATT 
ATCCTTGCCG CCATCAATTC ATCGGCCTTG GGCTTGGGGT CAGCTTTGGG AACGTTGCTT 
GGCGGCTTAT TGATTTCCTC TGGATTCAGG GGAATCTATC TTCCTTTTTC TGCTGCCACT 
TTATTGTTTT TCGTATTGAT AATTCAGCTG ATAGTAATTA ACACTTCACA TAAGGTAAAT 
AACATATGA

Protein sequence

MKKSLIFLAI GMFTVGCNTF LIAGLLPQIG ETLGQPVAVT GQGVSLFSLT YLLSAPLFSL 
IFVNQPVKRM VQLALTVFMF GNLITLLSEN IVLFLIGRSL AGAGTGIFTP LCISIAVHFA 
SPSAKGRILS FIWSANSAGV VFGVPAGLYL SSLFHWQLSI ASLIILSLLA LIGFSMQNID 
IKLPKPSPFG GRLRLLVEPK TLSVIGITCF TALASLGLYS YVTLIQSGSP NSLSMTLLSW 
GLGGFIGSSL IGVFIDRTGK PRVIMALILV GLMFALIAIP FTRNLPYLGL IPFFMWGACG 
WAIVTPQQHI LYELHENQGI ILAAINSSAL GLGSALGTLL GGLLISSGFR GIYLPFSAAT 
LLFFVLIIQL IVINTSHKVN NI