Gene B21_02748 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_02748
Symbol	yggW
ID	8116411
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	+
Start bp	2927330
End bp	2928466
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	53%
IMG OID	644848939
Product	hypothetical protein
Protein accession	YP_003000512
Protein GI	251786208
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0635] Coproporphyrinogen III oxidase and related Fe-S oxidoreductases
TIGRFAM ID	[TIGR00539] putative oxygen-independent coproporphyrinogen III oxidase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.153415
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTTAAAT TACCGCCGCT GAGTCTCTAC ATTCACATCC CGTGGTGCGT GCAGAAATGC 
CCGTACTGCG ATTTCAACTC TCACGCGTTG AAAGGAGAAG TGCCGCACGA CGATTATGTT 
CAGCATCTGC TTAACGATCT GGACAACGAT GTGGCTTACG CTCAGGGCCG TGAAGTGCAG 
ACAATCTTTA TTGGCGGTGG TACGCCGAGC CTGCTTTCCG GCCCGGCGAT GCAAACGCTG 
CTGGACGGCG TGCGTGCGCG TTTGCCGCTG ACAGCGGATG CAGAAATTAC TATGGAAGCG 
AACCCTGGTA CGGTAGAAGC CGATCGCTTT GTCGATTATC AGCGTGCTGG CGTGAACCGC 
ATCTCTATTG GCGTACAGAG TTTTAGCGAA GAAAAGCTGA AACGACTTGG GCGCATTCAT 
GGCCCGCAAG AAGCGAAACG AGCTGCGAAT CTGGCAAGCG GGCTGGGGCT GCGTAGTTTT 
AACCTTGATT TGATGCATGG GCTGCCGGAT CAATCACTGG AAGAGGCGCT TGGCGATCTG 
CGCCAGGCCA TTGAACTGAA TCCGCCGCAT CTTTCCTGGT ATCAACTGAC CATCGAACCT 
AATACGCTGT TTGGCTCGCG CCCTCCTGTA CTGCCGGACG ATGACGCGCT GTGGGATATT 
TTCGAACAGG GGCATCAGTT ATTAACCGCA GCGGGTTATC AGCAATATGA AACTTCCGCT 
TACGCCAAAC CCGGTTATCA GTGCCAGCAC AATCTCAACT ACTGGCGCTT TGGTGACTAC 
ATTGGTATTG GCTGCGGCGC GCATGGCAAA GTGACCTTCC CGGATGGGCG CATTCTGCGT 
ACCACCAAAA CGCGTCATCC GCGTGGTTTT ATGCAGGGGC GGTATCTGGA AAGCCAGCGT 
GATGTCGAAG CCGCAGATAA GCCGTTTGAG TTCTTTATGA ATCGCTTCCG TTTGCTGGAA 
GCCGCGCCGC GCGTGGAGTT TAGCCAGTAT ACTGGCCTTT CAGAAGAGGT TATTCGCCCT 
CAGTTAGACG AGGCTATTGC TCAGGGTTAT CTCACAGAAT GTGCGGATTA CTGGCAGATA 
ACGGAACATG GGAAGTTGTT TTTAAATTCG CTGCTGGAGC TTTTTCTGGC TGAGTAA

Protein sequence

MVKLPPLSLY IHIPWCVQKC PYCDFNSHAL KGEVPHDDYV QHLLNDLDND VAYAQGREVQ 
TIFIGGGTPS LLSGPAMQTL LDGVRARLPL TADAEITMEA NPGTVEADRF VDYQRAGVNR 
ISIGVQSFSE EKLKRLGRIH GPQEAKRAAN LASGLGLRSF NLDLMHGLPD QSLEEALGDL 
RQAIELNPPH LSWYQLTIEP NTLFGSRPPV LPDDDALWDI FEQGHQLLTA AGYQQYETSA 
YAKPGYQCQH NLNYWRFGDY IGIGCGAHGK VTFPDGRILR TTKTRHPRGF MQGRYLESQR 
DVEAADKPFE FFMNRFRLLE AAPRVEFSQY TGLSEEVIRP QLDEAIAQGY LTECADYWQI 
TEHGKLFLNS LLELFLAE