Gene ECD_02404 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_02404
Symbol	yfgL
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	-
Start bp	2501954
End bp	2503132
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	53%
IMG OID
Product	protein assembly complex, lipoprotein component
Protein accession	ACT44224
Protein GI	253978554
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.005806
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAATTGC GTAAATTACT GCTGCCAGGA CTGCTTTCCG TTACCCTTTT AAGCGGCTGT 
TCGCTGTTTA ACAGCGAAGA AGATGTGGTA AAGATGTCCC CATTGCCAAC CGTTGAAAAC 
CAGTTTACGC CGACCACGGC GTGGAGCACT TCCGTTGGTA GCGGCATTGG CAACTTCTAT 
TCCAATCTTC ATCCGGCACT GGCGGACAAC GTTGTCTATG CAGCGGACCG CGCTGGTTTA 
GTAAAAGCGC TGAATGCGGA TGATGGCAAA GAAATCTGGT CTGTCAGCCT GGCCGAGAAA 
GATGGCTGGT TCTCTAAAGA GCCTGCATTA CTTTCTGGCG GTGTGACCGT GTCTGGTGGG 
CATGTCTACA TTGGCAGCGA AAAGGCGCAG GTTTACGCGC TGAATACCAG CGATGGTACT 
GTGGCATGGC AAACTAAAGT CGCGGGTGAA GCACTTTCGC GCCCGGTGGT CAGCGACGGT 
CTGGTGTTAA TCCACACCAG TAACGGTCAG TTACAAGCGC TGAACGAAGC TGACGGCGCT 
GTCAAATGGA CAGTTAACCT CGATATGCCT TCGCTCTCTT TGCGTGGCGA GTCTGCGCCG 
GCAACGGCTT TTGGTGCGGC CGTCGTGGGG GGCGATAATG GTCGCGTCAG CGCAGTGCTG 
ATGGAACAGG GCCAGATGAT TTGGCAGCAG CGTATTTCCC AGGCGACCGG TTCTACCGAA 
ATTGACCGTC TGAGCGATGT TGACACGACT CCCGTCGTTG TTAACGGCGT TGTTTTCGCG 
CTGGCCTATA ATGGTAACCT GACGGCGCTT GATCTGCGCA GTGGTCAGAT TATGTGGAAA 
CGCGAACTGG GTTCGGTGAA TGATTTCATC GTCGACGGCA ATCGCATCTA TCTGGTCGAT 
CAAAATGACC GGGTGATGGC GTTGACCATT GATGGCGGCG TTACGCTGTG GACACAAAGC 
GATCTGCTGC ATCGCCTGCT GACTTCTCCG GTGCTGTATA ATGGCAACCT GGTGGTCGGT 
GACAGTGAAG GTTATCTGCA CTGGATTAAC GTCGAAGATG GTCGTTTCGT TGCCCAGCAA 
AAAGTTGATA GTTCCGGTTT CCAGACTGAA CCGGTTGCCG CTGACGGCAA ACTGCTGATC 
CAGGCAAAAG ACGGAACCGT GTACTCTATT ACACGTTAA

Protein sequence

MQLRKLLLPG LLSVTLLSGC SLFNSEEDVV KMSPLPTVEN QFTPTTAWST SVGSGIGNFY 
SNLHPALADN VVYAADRAGL VKALNADDGK EIWSVSLAEK DGWFSKEPAL LSGGVTVSGG 
HVYIGSEKAQ VYALNTSDGT VAWQTKVAGE ALSRPVVSDG LVLIHTSNGQ LQALNEADGA 
VKWTVNLDMP SLSLRGESAP ATAFGAAVVG GDNGRVSAVL MEQGQMIWQQ RISQATGSTE 
IDRLSDVDTT PVVVNGVVFA LAYNGNLTAL DLRSGQIMWK RELGSVNDFI VDGNRIYLVD 
QNDRVMALTI DGGVTLWTQS DLLHRLLTSP VLYNGNLVVG DSEGYLHWIN VEDGRFVAQQ 
KVDSSGFQTE PVAADGKLLI QAKDGTVYSI TR