Gene EcDH1_1156 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_1156
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	1245110
End bp	1246288
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	53%
IMG OID
Product	outer membrane assembly lipoprotein YfgL
Protein accession	ACX38830
Protein GI	260448408
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.00537914
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAATTGC GTAAATTACT GCTGCCAGGA CTGCTTTCCG TTACCCTTTT AAGCGGCTGT 
TCGCTGTTTA ACAGCGAAGA AGATGTGGTA AAGATGTCCC CATTGCCAAC CGTTGAAAAC 
CAGTTTACGC CGACCACGGC GTGGAGCACT TCCGTTGGTA GCGGCATTGG CAACTTCTAT 
TCCAATCTTC ATCCGGCACT GGCGGACAAC GTTGTCTATG CAGCGGACCG CGCTGGTTTA 
GTAAAAGCGC TGAATGCGGA TGATGGCAAA GAAATCTGGT CTGTCAGCCT GGCCGAGAAA 
GATGGCTGGT TCTCTAAAGA GCCTGCATTA CTTTCTGGCG GTGTGACCGT GTCTGGTGGG 
CATGTCTACA TTGGCAGCGA AAAGGCGCAG GTTTACGCGC TGAATACCAG CGATGGTACT 
GTGGCATGGC AAACTAAAGT CGCGGGTGAA GCACTTTCGC GCCCGGTGGT CAGCGACGGT 
CTGGTGTTAA TCCACACCAG TAACGGTCAG TTACAAGCGC TGAACGAAGC TGACGGCGCT 
GTCAAATGGA CAGTTAACCT CGATATGCCT TCGCTCTCTT TGCGTGGCGA GTCTGCGCCG 
ACAACGGCTT TTGGTGCGGC CGTCGTGGGG GGCGATAATG GTCGCGTCAG CGCAGTGCTG 
ATGGAACAGG GCCAGATGAT TTGGCAGCAG CGTATTTCCC AGGCGACCGG TTCTACCGAA 
ATTGACCGTC TGAGCGATGT TGACACGACT CCCGTCGTTG TTAACGGCGT TGTTTTCGCG 
CTGGCCTATA ATGGTAACCT GACGGCGCTT GATCTGCGCA GTGGTCAGAT TATGTGGAAA 
CGCGAACTGG GTTCGGTGAA TGATTTCATC GTCGACGGCA ATCGCATCTA TCTGGTCGAT 
CAAAATGACC GGGTGATGGC GTTGACCATT GATGGCGGCG TTACGCTGTG GACACAAAGC 
GATCTGCTGC ATCGCCTGCT GACTTCTCCG GTGCTGTATA ATGGCAACCT GGTGGTCGGT 
GACAGTGAAG GTTATCTGCA CTGGATTAAC GTCGAAGATG GTCGTTTCGT TGCCCAGCAA 
AAAGTTGATA GTTCCGGTTT CCAGACTGAA CCGGTTGCCG CTGACGGCAA ACTGCTGATC 
CAGGCAAAAG ACGGAACCGT GTACTCTATT ACACGTTAA

Protein sequence

MQLRKLLLPG LLSVTLLSGC SLFNSEEDVV KMSPLPTVEN QFTPTTAWST SVGSGIGNFY 
SNLHPALADN VVYAADRAGL VKALNADDGK EIWSVSLAEK DGWFSKEPAL LSGGVTVSGG 
HVYIGSEKAQ VYALNTSDGT VAWQTKVAGE ALSRPVVSDG LVLIHTSNGQ LQALNEADGA 
VKWTVNLDMP SLSLRGESAP TTAFGAAVVG GDNGRVSAVL MEQGQMIWQQ RISQATGSTE 
IDRLSDVDTT PVVVNGVVFA LAYNGNLTAL DLRSGQIMWK RELGSVNDFI VDGNRIYLVD 
QNDRVMALTI DGGVTLWTQS DLLHRLLTSP VLYNGNLVVG DSEGYLHWIN VEDGRFVAQQ 
KVDSSGFQTE PVAADGKLLI QAKDGTVYSI TR