Gene EcHS_A2072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A2072
Symbol
ID	5594119
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	2058578
End bp	2059582
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	52%
IMG OID	640921213
Product	putative sulfite oxidase subunit YedY
Protein accession	YP_001458757
Protein GI	157161439
COG category	[R] General function prediction only
COG ID	[COG2041] Sulfite oxidase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	3.41751e-19
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAGA ATCAATTTTT AAAAGAATCA GATGTTACGG CCGAGTCGGT ATTCTTTATG 
AAGCGTCGGC AGGTGTTAAA AGCACTGGGC ATCAGTGCAG CTGCACTTTC TTTGCCTCAC 
GCTGCGCATG CCGATCTGCT TAGCTGGTTT AAAGGGAACG ATCGCCCGCT CGCCCCCGCC 
GGAAAACCGC TGGAGTTCAG CAAGCCTGCC GCCTGGCAAA ATAACCTGCC ACTGACGCCA 
GTAGATAAAG TCTCCGGTTA TAACAACTTC TATGAATTCG GGCTGGATAA AGCCGATCCC 
GCCGCTAATG CTGGTAGCCT GAAAACCGAT CCATGGACAC TGAAAATCAG CGGCGAAGTG 
GCAAAACCAT TGACCCTCGA TCACGATGAT TTAACCCGTC GCTTCCCGCT GGAAGAGCGT 
ATTTATCGTA TGCGCTGCGT GGAGGCATGG TCGATGGTGG TGCCGTGGAT TGGTTTTCCG 
CTGCACAAAT TGCTGGCGCT TGCCGAACCC ACCAGCAATG CGAAGTATGT CGCTTTCGAA 
ACAATTTATG CACCGGAACA AATGCCAGGC CAGCAGGACC GCTTTATCGG CGGCGGGCTG 
AAATATCCTT ATGTCGAAGG ATTGCGTCTC GACGAAGCAA TGCATCCGCT CACACTGATG 
ACCGTGGGTG TTTATGGCAA GGCGTTACCG CCACAAAATG GCGCGCCGGT ACGACTGATT 
GTGCCGTGGA AATATGGCTT TAAAGGGATT AAATCGATAG TTAGTATTAA GCTGACCCGC 
GAGCGTCCGC CAACCACCTG GAATCTGGCA GCGCCTGACG AATACGGTTT TTACGCCAAC 
GTTAATCCGC ATGTTGATCA CCCGCGCTGG TCACAGGCTA CCGAACGATT TATTGGTTCA 
GGCGGCATCC TCGATGTTCA GCGCCAGCCA ACGCTACTGT TTAATGGTTA CGCCGACCAG 
GTGGCATCGC TGTATCGTGG CCTGGATTTG CGGGAGAATT TCTGA

Protein sequence

MKKNQFLKES DVTAESVFFM KRRQVLKALG ISAAALSLPH AAHADLLSWF KGNDRPLAPA 
GKPLEFSKPA AWQNNLPLTP VDKVSGYNNF YEFGLDKADP AANAGSLKTD PWTLKISGEV 
AKPLTLDHDD LTRRFPLEER IYRMRCVEAW SMVVPWIGFP LHKLLALAEP TSNAKYVAFE 
TIYAPEQMPG QQDRFIGGGL KYPYVEGLRL DEAMHPLTLM TVGVYGKALP PQNGAPVRLI 
VPWKYGFKGI KSIVSIKLTR ERPPTTWNLA APDEYGFYAN VNPHVDHPRW SQATERFIGS 
GGILDVQRQP TLLFNGYADQ VASLYRGLDL RENF