Gene EcE24377A_2202 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_2202
Symbol
ID	5586868
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	+
Start bp	2168944
End bp	2169948
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	53%
IMG OID	640925871
Product	putative sulfite oxidase subunit YedY
Protein accession	YP_001463271
Protein GI	157157814
COG category	[R] General function prediction only
COG ID	[COG2041] Sulfite oxidase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.00000714656
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAGA AGCAATTTTT AAAAGAATCA GATGTTACGG CCGAGTCGGT ATTCTTTATG 
AAGCGTCGAC AGGTGTTAAA AGCACTGGGC ATCAGCGCAG CTGCACTTTC TTTGCCTCAC 
GCTGCGCATG CCGATCTGCT TAGCTGGTTT AAAGGGAACG ATCGCCCGCC CGCCCCCGCC 
GGAAAACCGC TGGAGTTCAG CAAGCCTGCC GCCTGGCAAA ATAACCTGCC ACTGACGCCA 
GTAGATAAAG TCTCCGGTTA TAACAACTTC TATGAATTCG GGCTGGATAA AGCCGATCCC 
GCCGCTAATG CTGGTAGCCT GAAAACCGAT CCATGGACAC TGAAAATCAG CGGCGAAGTG 
GCAAAACCAT TGACCCTCGA TCACGATGAT TTAACCCGTC GCTTCCCGCT GGAAGAGCGT 
ATTTATCGTA TGCGCTGCGT GGAGGCATGG TCGATGGTGG TGCCGTGGAT TGGTTTTCCG 
CTGCACAAAT TGCTGGCGCT TGCCGAACCC ACCAGCAATG CGAAGTATGT CGCTTTCGAA 
ACAATTTATG CACCGGAACA AATGCCAGGC CAGCAGGACC GCTTTATCGG CGGCGGGCTG 
AAATATCCTT ATGTCGAAGG ATTGCGTCTC GACGAAGCAA TGCATCCGCT CACACTGATG 
ACCGTGGGTG TTTATGGCAA GGCGTTACCG CCACAAAATG GCGCGCCGGT ACGACTGATT 
GTGCCGTGGA AATATGGCTT TAAAGGGATT AAATCGATAG TCAGTATTAA GCTGACCCGC 
GAGCGTCCGC CAACCACCTG GAATCTGGCA GCGCCTGACG AATACGGTTT TTACGCCAAC 
GTTAATCCGC ATGTTGATCA CCCGCGCTGG TCACAGGCTA CCGAACGATT TATTGGTTCA 
GGCGGCATCC TCGATGTTCA GCGCCAGCCA ACGCTACTGT TTAATGGTTA CGCCGACCAG 
GTGGCATCGC TGTATCGTGG CCTGGATTTG CGGGAGAATT TCTGA

Protein sequence

MKKKQFLKES DVTAESVFFM KRRQVLKALG ISAAALSLPH AAHADLLSWF KGNDRPPAPA 
GKPLEFSKPA AWQNNLPLTP VDKVSGYNNF YEFGLDKADP AANAGSLKTD PWTLKISGEV 
AKPLTLDHDD LTRRFPLEER IYRMRCVEAW SMVVPWIGFP LHKLLALAEP TSNAKYVAFE 
TIYAPEQMPG QQDRFIGGGL KYPYVEGLRL DEAMHPLTLM TVGVYGKALP PQNGAPVRLI 
VPWKYGFKGI KSIVSIKLTR ERPPTTWNLA APDEYGFYAN VNPHVDHPRW SQATERFIGS 
GGILDVQRQP TLLFNGYADQ VASLYRGLDL RENF