Gene B21_02366 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_02366
Symbol	yfgL
ID	8114153
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	2501163
End bp	2502341
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	53%
IMG OID	644848568
Product	hypothetical protein
Protein accession	YP_003000141
Protein GI	251785837
COG category	[S] Function unknown
COG ID	[COG1520] FOG: WD40-like repeat
TIGRFAM ID	[TIGR03300] outer membrane assembly lipoprotein YfgL

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0111233
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAATTGC GTAAATTACT GCTGCCAGGA CTGCTTTCCG TTACCCTTTT AAGCGGCTGT 
TCGCTGTTTA ACAGCGAAGA AGATGTGGTA AAGATGTCCC CATTGCCAAC CGTTGAAAAC 
CAGTTTACGC CGACCACGGC GTGGAGCACT TCCGTTGGTA GCGGCATTGG CAACTTCTAT 
TCCAATCTTC ATCCGGCACT GGCGGACAAC GTTGTCTATG CAGCGGACCG CGCTGGTTTA 
GTAAAAGCGC TGAATGCGGA TGATGGCAAA GAAATCTGGT CTGTCAGCCT GGCCGAGAAA 
GATGGCTGGT TCTCTAAAGA GCCTGCATTA CTTTCTGGCG GTGTGACCGT GTCTGGTGGG 
CATGTCTACA TTGGCAGCGA AAAGGCGCAG GTTTACGCGC TGAATACCAG CGATGGTACT 
GTGGCATGGC AAACTAAAGT CGCGGGTGAA GCACTTTCGC GCCCGGTGGT CAGCGACGGT 
CTGGTGTTAA TCCACACCAG TAACGGTCAG TTACAAGCGC TGAACGAAGC TGACGGCGCT 
GTCAAATGGA CAGTTAACCT CGATATGCCT TCGCTCTCTT TGCGTGGCGA GTCTGCGCCG 
GCAACGGCTT TTGGTGCGGC CGTCGTGGGG GGCGATAATG GTCGCGTCAG CGCAGTGCTG 
ATGGAACAGG GCCAGATGAT TTGGCAGCAG CGTATTTCCC AGGCGACCGG TTCTACCGAA 
ATTGACCGTC TGAGCGATGT TGACACGACT CCCGTCGTTG TTAACGGCGT TGTTTTCGCG 
CTGGCCTATA ATGGTAACCT GACGGCGCTT GATCTGCGCA GTGGTCAGAT TATGTGGAAA 
CGCGAACTGG GTTCGGTGAA TGATTTCATC GTCGACGGCA ATCGCATCTA TCTGGTCGAT 
CAAAATGACC GGGTGATGGC GTTGACCATT GATGGCGGCG TTACGCTGTG GACACAAAGC 
GATCTGCTGC ATCGCCTGCT GACTTCTCCG GTGCTGTATA ATGGCAACCT GGTGGTCGGT 
GACAGTGAAG GTTATCTGCA CTGGATTAAC GTCGAAGATG GTCGTTTCGT TGCCCAGCAA 
AAAGTTGATA GTTCCGGTTT CCAGACTGAA CCGGTTGCCG CTGACGGCAA ACTGCTGATC 
CAGGCAAAAG ACGGAACCGT GTACTCTATT ACACGTTAA

Protein sequence

MQLRKLLLPG LLSVTLLSGC SLFNSEEDVV KMSPLPTVEN QFTPTTAWST SVGSGIGNFY 
SNLHPALADN VVYAADRAGL VKALNADDGK EIWSVSLAEK DGWFSKEPAL LSGGVTVSGG 
HVYIGSEKAQ VYALNTSDGT VAWQTKVAGE ALSRPVVSDG LVLIHTSNGQ LQALNEADGA 
VKWTVNLDMP SLSLRGESAP ATAFGAAVVG GDNGRVSAVL MEQGQMIWQQ RISQATGSTE 
IDRLSDVDTT PVVVNGVVFA LAYNGNLTAL DLRSGQIMWK RELGSVNDFI VDGNRIYLVD 
QNDRVMALTI DGGVTLWTQS DLLHRLLTSP VLYNGNLVVG DSEGYLHWIN VEDGRFVAQQ 
KVDSSGFQTE PVAADGKLLI QAKDGTVYSI TR