Gene EcE24377A_4630 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_4630
Symbol	nrfE
ID	5589257
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	+
Start bp	4630594
End bp	4632252
Gene Length	1659 bp
Protein Length	552 aa
Translation table	11
GC content	57%
IMG OID	640928246
Product	heme lyase subunit NrfE
Protein accession	YP_001465578
Protein GI	157158945
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1138] Cytochrome c biogenesis factor
TIGRFAM ID	[TIGR00353] c-type cytochrome biogenesis protein CcmF

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTTGACCC CGTTGACGGC CTTTGCGGGA GTGCGGTTGC GCTGGCCTGC CATGATGCGA 
CTCACTTGCA TCGGCATTCT GGCACAGTTC GCGCTCCTGC TGCTCGCCTT TGGCGTACTG 
ACGTATTGTT TTCTCATCAG CGATTTCTCG GTCATTTATG TCGCGCAACA TAGCTACAGC 
CTGCTGTCGT GGGAACTCAA GCTGGCAGCG GTGTGGGGCG GTCATGAAGG TTCGCTGCTG 
CTTTGGGTGC TGCTGCTTTC CGCCTGGAGC GCGCTGTTTG CCTGGCATTA TCGGCAGCAA 
ACCGATCCGC TATTTCCGCT GACGCTAGCC GTTTTATCTC TCATGCTCGC CGCACTGCTA 
CTGTTTGTGG TGCTGTGGTC CGATCCCTTC ATGCGGATAT TTCCACCAGC AATCGAAGGC 
CGCGATCTCA ATCCGATGCT GCAACATCCC GGTCTTATCT TCCATCCGCC GCTGCTTTAT 
CTCGGCTATG GCGGTTTGAT GGTAGCGGCG AGCGTGGCGC TGGCGAGTTT ACTGCGCGGC 
GAGTTTGATG GTGCCTGCGC CAGAATTTGT TGGCGCTGGG CACTACCTGG CTGGAGCGCA 
TTAACGGCGG GGATCATCCT CGGTTCCTGG TGGGCCTATT GCGAACTGGG CTGGGGCGGC 
TGGTGGTTCT GGGATCCGGT GGAAAACGCC TCTTTATTAC CCTGGCTTTC TGCCACTGCG 
CTGCTGCACA GTTTGTCCCT GACACGCCAG CGGGAGATTT TCCGCCACTG GTCGCTGTTG 
CTGGCGATAG TAACTCTGAT GCTGTCGCTA CTGGGTACCT TAATTGTCCG TTCTGGCATT 
CTGGTTTCGG TTCATGCGTT CGCACTGGAT AACGTCCGCG CCGTGCCGTT GTTCAGCCTG 
TTTGCACTGA TTAGCCTTGC GTCTCTGGCT CTGTATGGCT GGCGAGCGCG GGACGGTGGC 
CCGGTGGTGC GTTTTTCGGG GTTATCGCGG GAAATGTTAA TCCTCGCTAC GCTGTTGCTG 
TTTTGCGCAG TGCTACTGAT CGTGCTGGTG GGAACGCTTT ATCCGATGAT TTACGGTCTG 
CTGGGCTGGG GACGCCTCTC CGTTGGCGCG CCGTATTTTA ACCGCGCGAC GTTACCGTTT 
GGCCTGTTGA TGCTGGTGGT GATTGTGCTG GCGACGTTTG TCTCTGGCAA ACGCGTGCAG 
CTTCCGGCGC TGGTAGCTCA TGCAGGCGTG CTGTTATTTG CCGCAGGGAT CGTGGTTTCC 
AGCGTCAGCC GTCAGGAGAT CAGCCTGAAT TTACAGCCGG GTCAGCAGGT GACGCTGGCA 
GGATACACCT TCCATTTTGA GCGCCTCGAT CTGCAAGCCA AAGGCAATTA CACCAGCGAA 
AAAGCGATAG TGGCACTGTT TGACCATCAG CAACGCATTG GTGAACTGAT GCCGGAGCGG 
CGTTTTTACG AAGCACGTCG TCAGCAAATG ATGGAACCGT CAATTCGCTG GAACGGCATC 
CATGACTGGT ATGCGGTCAT GGGTGAAAAA ACCGGAGCGG ATCGTTACGC TTTTCGTTTG 
TATGTACAAA GCGGTGTGCG CTGGATCTGG GGGGGAGGAT TGTTGATGAT TGCGGGCGCA 
TTGTTAAGCG GATGGCGGGG GAAGAAGCGC GATGAATAA

Protein sequence

MLTPLTAFAG VRLRWPAMMR LTCIGILAQF ALLLLAFGVL TYCFLISDFS VIYVAQHSYS 
LLSWELKLAA VWGGHEGSLL LWVLLLSAWS ALFAWHYRQQ TDPLFPLTLA VLSLMLAALL 
LFVVLWSDPF MRIFPPAIEG RDLNPMLQHP GLIFHPPLLY LGYGGLMVAA SVALASLLRG 
EFDGACARIC WRWALPGWSA LTAGIILGSW WAYCELGWGG WWFWDPVENA SLLPWLSATA 
LLHSLSLTRQ REIFRHWSLL LAIVTLMLSL LGTLIVRSGI LVSVHAFALD NVRAVPLFSL 
FALISLASLA LYGWRARDGG PVVRFSGLSR EMLILATLLL FCAVLLIVLV GTLYPMIYGL 
LGWGRLSVGA PYFNRATLPF GLLMLVVIVL ATFVSGKRVQ LPALVAHAGV LLFAAGIVVS 
SVSRQEISLN LQPGQQVTLA GYTFHFERLD LQAKGNYTSE KAIVALFDHQ QRIGELMPER 
RFYEARRQQM MEPSIRWNGI HDWYAVMGEK TGADRYAFRL YVQSGVRWIW GGGLLMIAGA 
LLSGWRGKKR DE