Gene EcDH1_2531 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_2531
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	2703113
End bp	2704312
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	54%
IMG OID
Product	lipoprotein releasing system, transmembrane protein, LolC/E family
Protein accession	ACX40167
Protein GI	260449745
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0000000306464
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTACCAAC CTGTCGCTCT ATTTATTGGC CTGCGTTACA TGCGTGGGCG TGCAGCGGAT 
CGCTTCGGTC GTTTCGTCTC CTGGCTTTCT ACCATCGGCA TTACCCTCGG GGTGATGGCG 
CTGGTCACAG TATTGTCAGT GATGAACGGC TTTGAGCGCG AGCTGCAAAA CAACATCCTT 
GGCCTGATGC CACAGGCAAT TCTCTCTTCT GAGCATGGCT CTCTTAACCC GCAGCAACTC 
CCAGAAACGG CAGTCAAACT GGACGGCGTT AATCGCGTCG CACCTATTAC TACCGGTGAT 
GTGGTACTGC AAAGCGCGCG CAGCGTGGCG GTCGGGGTGA TGCTCGGTAT CGACCCGGCG 
CAAAAAGATC CACTTACACC GTATCTGGTC AATGTGAAAC AAACTGACCT CGAGCCGGGG 
AAATATAATG TCATCCTCGG CGAACAACTT GCCTCACAGC TAGGCGTTAA TCGCGGTGAT 
CAAATCCGCG TGATGGTACC ATCTGCCAGC CAGTTCACGC CGATGGGGCG TATTCCAAGC 
CAGCGCCTGT TCAATGTGAT TGGCACTTTC GCCGCCAACA GTGAAGTCGA TGGCTATGAA 
ATGCTGGTGA ATATTGAGGA TGCCTCGCGT CTGATGCGTT ATCCGGCAGG CAATATTACC 
GGCTGGCGTT TGTGGCTGGA TGAGCCGCTG AAAGTCGACT CATTAAGTCA GCAAAAACTG 
CCTGAAGGCA GCAAATGGCA GGACTGGCGT GATCGTAAAG GCGAGTTGTT CCAGGCCGTA 
CGCATGGAAA AAAATATGAT GGGTTTACTG CTGAGCCTGA TTGTCGCCGT TGCGGCGTTT 
AACATTATTA CCTCACTAGG GCTGATGGTA ATGGAGAAGC AGGGCGAAGT AGCGATCCTG 
CAAACGCAAG GCTTAACTCC GCGACAAATC ATGATGGTCT TTATGGTGCA AGGGGCCAGC 
GCCGGGATTA TCGGTGCGAT CCTCGGAGCG GCGCTTGGCG CCCTGCTTGC CAGCCAGTTA 
AATAATCTGA TGCCGATAAT CGGCGTCCTG CTTGATGGCG CGGCGCTGCC GGTGGCTATC 
GAACCTTTAC AGGTCATTGT TATTGCGCTG GTGGCGATGG CTATCGCGCT GCTGTCTACG 
CTTTACCCTT CATGGCGCGC TGCCGCCACT CAACCCGCTG AGGCTTTACG TTATGAATAA

Protein sequence

MYQPVALFIG LRYMRGRAAD RFGRFVSWLS TIGITLGVMA LVTVLSVMNG FERELQNNIL 
GLMPQAILSS EHGSLNPQQL PETAVKLDGV NRVAPITTGD VVLQSARSVA VGVMLGIDPA 
QKDPLTPYLV NVKQTDLEPG KYNVILGEQL ASQLGVNRGD QIRVMVPSAS QFTPMGRIPS 
QRLFNVIGTF AANSEVDGYE MLVNIEDASR LMRYPAGNIT GWRLWLDEPL KVDSLSQQKL 
PEGSKWQDWR DRKGELFQAV RMEKNMMGLL LSLIVAVAAF NIITSLGLMV MEKQGEVAIL 
QTQGLTPRQI MMVFMVQGAS AGIIGAILGA ALGALLASQL NNLMPIIGVL LDGAALPVAI 
EPLQVIVIAL VAMAIALLST LYPSWRAAAT QPAEALRYE