Gene EcolC_1456 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1456
Symbol
ID	6067334
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	1604139
End bp	1605191
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	53%
IMG OID	641600875
Product	cytochrome C biogenesis protein
Protein accession	YP_001724446
Protein GI	170019492
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG3088] Uncharacterized protein involved in biosynthesis of c-type cytochromes [COG4235] Cytochrome c biogenesis factor
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGTTTT TATTGGGCGT GCTGATGCTG ATGATCTCCG GCTCAGCACT GGCGACCATC 
GACGTGTTGC AGTTTAAAGA TGAAGCACAG GAACAACAGT TCCGTCAGCT CACTGAAGAA 
CTGCGCTGCC CGAAATGCCA GAACAACAGC ATTGCCGATT CCAACTCGAT GATTGCCACC 
GACCTGCGTC AGAAAGTGTA TGAACTGATG CAGGAAGGTA AAAGTAAAAA AGAGATTGTC 
GATTATATGG TGGCGCGTTA CGGCAATTTC GTCACTTACG ATCCGCCGTT AACGCCGCTG 
ACCGTGCTGC TGTGGGTGCT TCCGGTAGTG GCTATTGGCA TTGGCGGTTG GGTCATATAC 
GCCCGCTCGC GGCGTCGGGT ACGCGTAGTG CCGGAAGCGT TTCCTGAACA AAGCGTGCAG 
GAAGGTAAGC GTGCCGGATA TATTGTTTAT CTGCCGGGTA TTGTGGTGGC GTTAATTGTG 
GCTGGCGTCA GCTACTACCA GACTGGCAAT TATCAGCAGG TGAAAATCTG GCAGCAGGCC 
ACGGCACAGG CTCCGGCGTT GCTGGACAGG GCGCTGGATC CGAAAACCGA TCCGCTCAAC 
GAAGAAGAGA TGTCGCGTCT TGCGCTGGGG ATGCGTACTC AACTGCAAAA AAATCCGGGA 
GATATAGAAG GCTGGATTAT GTTGGGCCGC GTTGGCATGG CGCTGGGTAA CGCTAGTATC 
GCCACCGATG CATACGCTAC TGCGTATCGC CTCGATCCGA AAAACAGCGA TGCCGCACTG 
GGTTATGCTG AAGCGTTGAC ACGTTCATCT GATCCCAACG ACAACCGCCT CGGTGGTGAA 
CTGCTGCGCC AGTTGGTGAG AAGCGACCAC AGCAATATCC GTGTGTTAAG CATGTATGCG 
TTTAATGCCT TTGAGCAGCA GCGATTTGGC GAAGCCGTTG CCGCGTGGGA GATGATGTTG 
AAACTCTTAC CTGCCAACGA TACTCGCCGT GCGGTGATTG AACGTAGTAT CGCGCAGGCG 
ATGCAACATT TGTCGCCGCA GGAGAGTAAA TAA

Protein sequence

MRFLLGVLML MISGSALATI DVLQFKDEAQ EQQFRQLTEE LRCPKCQNNS IADSNSMIAT 
DLRQKVYELM QEGKSKKEIV DYMVARYGNF VTYDPPLTPL TVLLWVLPVV AIGIGGWVIY 
ARSRRRVRVV PEAFPEQSVQ EGKRAGYIVY LPGIVVALIV AGVSYYQTGN YQQVKIWQQA 
TAQAPALLDR ALDPKTDPLN EEEMSRLALG MRTQLQKNPG DIEGWIMLGR VGMALGNASI 
ATDAYATAYR LDPKNSDAAL GYAEALTRSS DPNDNRLGGE LLRQLVRSDH SNIRVLSMYA 
FNAFEQQRFG EAVAAWEMML KLLPANDTRR AVIERSIAQA MQHLSPQESK