Gene EcolC_1674 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1674
Symbol
ID	6065742
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	1876687
End bp	1877691
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	53%
IMG OID	641601088
Product	putative sulfite oxidase subunit YedY
Protein accession	YP_001724653
Protein GI	170019699
COG category	[R] General function prediction only
COG ID	[COG2041] Sulfite oxidase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00322488
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.215149
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAGA ATCAATTTTT AAAAGAATCA GATGTTACGG CCGAGTCGGT ATTCTTTATG 
AAGCGTCGGC AGGTGTTAAA AGCACTGGGC ATCAGCGCAG CTGCACTTTC TTTGCCTCAC 
GCTGCGCATG CCGATCTGCT TAGCTGGTTT AAAGGGAACG ATCGCCCACC CGCCCCCGCC 
GGAAAACCGC TGGAGTTCAG CAAGCCTGCC GCCTGGCAAA ATAACCTGCC ACTGACGCCA 
GCAGATAAAG TTTCCGGCTA TAACAACTTC TATGAATTCG GGCTGGATAA AGCCGATCCC 
GCCGCTAATG CTGGTAGCCT GAAAACCGAT CCATGGACAC TGAAAATCAG CGGCGAAGTG 
GCAAAACCAT TGACCCTCGA TCACGATGAT TTAACCCGTC GCTTCCCGCT GGAAGAGCGT 
ATTTATCGTA TGCGCTGCGT GGAAGCGTGG TCGATGGTGG TGCCGTGGAT TGGTTTTCCG 
CTGCACAAAT TGCTGGCGCT TGCCGAACCC ACCAGCAATG CGAAGTATGT CGCTTTCGAA 
ACAATTTATG CACCGGAACA GATGCCTGGT CAGCAGGACC GCTTTATCGG CGGCGGGCTG 
AAATATCCTT ATGTCGAAGG ATTGCGTCTC GACGAAGCAA TGCATCCGCT CACACTGATG 
ACCGTGGGTG TTTATGGCAA GGCGTTACCG CCACAAAATG GCGCGCCGGT ACGACTGATT 
GTGCCGTGGA AATATGGCTT TAAAGGGATT AAATCGATAG TCAGTATTAA GCTGACCCGC 
GAGCGTCCGC CAACCACCTG GAATCTGGCA GCGCCTGACG AATACGGTTT TTACGCCAAC 
GTTAATCCGC ATGTTGATCA CCCGCGCTGG TCACAGGCTA CCGAACGATT TATTGGTTCA 
GGCGGCATCC TCGATGTACA GCGCCAGCCA ACGCTACTGT TTAATGGTTA CGCCGACCAG 
GTGGCATCGC TGTATCGTGG CCTGGATTTG CGGGAGAATT TCTGA

Protein sequence

MKKNQFLKES DVTAESVFFM KRRQVLKALG ISAAALSLPH AAHADLLSWF KGNDRPPAPA 
GKPLEFSKPA AWQNNLPLTP ADKVSGYNNF YEFGLDKADP AANAGSLKTD PWTLKISGEV 
AKPLTLDHDD LTRRFPLEER IYRMRCVEAW SMVVPWIGFP LHKLLALAEP TSNAKYVAFE 
TIYAPEQMPG QQDRFIGGGL KYPYVEGLRL DEAMHPLTLM TVGVYGKALP PQNGAPVRLI 
VPWKYGFKGI KSIVSIKLTR ERPPTTWNLA APDEYGFYAN VNPHVDHPRW SQATERFIGS 
GGILDVQRQP TLLFNGYADQ VASLYRGLDL RENF