Gene SbBS512_E4595 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E4595
Symbol	nrfE
ID	6268938
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	+
Start bp	4291451
End bp	4293133
Gene Length	1683 bp
Protein Length	560 aa
Translation table	11
GC content	57%
IMG OID	641728371
Product	heme lyase subunit NrfE
Protein accession	YP_001882769
Protein GI	187731032
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1138] Cytochrome c biogenesis factor
TIGRFAM ID	[TIGR00353] c-type cytochrome biogenesis protein CcmF

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGTTGTTAA GTCTCGGGGT CAACGTGTTG ACCCCGTTGA CGGCCTTTGC GGGAGTGCGG 
TTGCGCTGGC CTGCCATGAT GCGACTCACT TGCATCGGCA TTCTGGCGCA GTTCGCGCTC 
CTGCTGCTCG CCTTTGGCGT ACTGACGTAT TGTTTTCTCA TCAGCGATTT CTCGGTCATT 
TATGTCGCCC AACATAGCTA CAGCCTGCTG TCGTGGGAAC TCAAACTGGC GGCGGTGTGG 
GGCGGTCATG AAGGTTCGCT GCTGCTTTGG GTGCTGCTGC TTTCCGCCTG GAGCGCGCTG 
TTTGCCTGGC ATTATCGGCA GCAAACCGAT CCGCTATTTC CGCTGACGCT AGCCGTTTTA 
TCTCTCATGC TCGCCGCACT GCTACTGTTT GTGGTGCTGT GGTCCGATCC CTTCGTGCGG 
ATATTTCCAC CAGCAATCGA AGGCCGCGAT CTCAATCCGA TGCTGCAACA TCCCGGTCTT 
ATCTTTCATC CACCGCTGCT TTACCTTGGC TATGGCGGTT TGATGGTAGC GGCGAGCGTG 
GCGCTGGCGA GTCTACTGCG CGGCGAGTTT GATGCGGCCA GCGCCCGAAT TTGCTGGCGC 
TGGGCGTTAC CTGGCTGGAG TGCATTAACG GCGGGGATCA TCCTCGGTTC CTGGTGGGCC 
TACTGCGAAC TCGGCTGGGG CGGCTGGTGG TTCTGGGATC CGGTGGAAAA TGCCTCTTTA 
TTACCCTGGC TTTCTGCCAC TGCGCTGCTG CACAGTTTAT CCCTGACACG CCAGCGGGGG 
ATTTTTCGCC ACTGGTCGCT GTTACTGGCG ATAGTTACTC TGATGCTGTC GCTGCTGGGC 
ACCTTAATTG TCCGTTCTGG CATTCTGGTT TCGGTTCATG CGTTCGCGCT GGATAACGTC 
CGCGCCGTGC CGTTGTTCAG CCTGTTTGCA CTGATTAGCC TTGCGTCTCT GGCTCTGTAT 
GGCTGGCGAG CGCGGGACGG TGGCCCGGCG GTGCGTTTTT CGGGGTTATC GCGGGAAATG 
TTAATCCTCG CTACGCTGTT GCTGTTTTGC GCAGTGCTAC TGATCGTGCT GGTGGGAACG 
CTTTATCCGA TGATTTACGG TCTGCTGGGC TGGGGACGCC TCTCCGTTGG CGCGCCGTAT 
TTTAACCGCG CGACGTTACC GTTTGGTCTG TTGATGCTGG TGGTGATTGT GCTGGCGACG 
TTTGTCTCTG GCAAACGCGT GCAGCTTCCG GCGCTGGTAG CTCATGCGGG CGTGCTGTTA 
TTTGCCGCTG GGATCGTGGT TTCCAGCGTC AGCCGTCAGG AGATCAGCCT GAATTTACAG 
CCGGGTCAGC AGGTGACGCT GGCAGGATAC ACCTTCCGTT TTGAGCGCCT CGATCTGCAA 
GCCAAAGGCA ATTACACCAG CGAAAAAGCG ATAGTGGCAC TGTTTGACCA TCAGCAACGC 
ATTGGTGAAC TGATGCCGGA GCGGCGTTTT TACGAAGCAC GTCGTCAGCA AATGATGGAA 
CCGTCAATTC GCTGGAACGG CATCCATGAC TGGTATGCGG TCATGGGTGA AAAAACCGGA 
GCGGATCGTT ACGCTTTTCG CTTGTATGTA CAAAGCGGTG TGCGCTGGAT CTGGGGGGGA 
GGATTGTTGA TGATTGCGGG CGCATTGTTA AGCGGATGGC GGGGGAGGAA GCGCGATGAA 
TAA

Protein sequence

MLLSLGVNVL TPLTAFAGVR LRWPAMMRLT CIGILAQFAL LLLAFGVLTY CFLISDFSVI 
YVAQHSYSLL SWELKLAAVW GGHEGSLLLW VLLLSAWSAL FAWHYRQQTD PLFPLTLAVL 
SLMLAALLLF VVLWSDPFVR IFPPAIEGRD LNPMLQHPGL IFHPPLLYLG YGGLMVAASV 
ALASLLRGEF DAASARICWR WALPGWSALT AGIILGSWWA YCELGWGGWW FWDPVENASL 
LPWLSATALL HSLSLTRQRG IFRHWSLLLA IVTLMLSLLG TLIVRSGILV SVHAFALDNV 
RAVPLFSLFA LISLASLALY GWRARDGGPA VRFSGLSREM LILATLLLFC AVLLIVLVGT 
LYPMIYGLLG WGRLSVGAPY FNRATLPFGL LMLVVIVLAT FVSGKRVQLP ALVAHAGVLL 
FAAGIVVSSV SRQEISLNLQ PGQQVTLAGY TFRFERLDLQ AKGNYTSEKA IVALFDHQQR 
IGELMPERRF YEARRQQMME PSIRWNGIHD WYAVMGEKTG ADRYAFRLYV QSGVRWIWGG 
GLLMIAGALL SGWRGRKRDE