Gene EcHS_A0654 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A0654
Symbol
ID	5591873
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	671430
End bp	672650
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	47%
IMG OID	640919835
Product	IbrA protein
Protein accession	YP_001457417
Protein GI	157160099
COG category	[R] General function prediction only
COG ID	[COG3969] Predicted phosphoadenosine phosphosulfate sulfotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	41
Plasmid unclonability p-value	0.533054
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTATTT ATAAAATTCC TCTTCCGCTC AATATTCTGG AAGCTGCACG AGAGCGTATT 
ACCTGGACAC TCAATACCCT ACCCCGCGTT TGTGTCTCAT TTTCTGGCGG CAAAGACTCT 
GGTTTAATGC TGCATCTGAC AGCCGAACTT GCCCGACAAA TGGGCAAAAA AATCTGCGTT 
TTGTTTATCG ACTGGGAGGC GCAATTCTCT TGCACCATTA ACTATGTTCA GTCCCTGCGC 
GAGTTGTACA CCGATGTCAT CGAAGAGTTT TACTGGGTTG CGCTCCCGCT TACGACGCAA 
AATTCCCTTT CACAATACCA ACCCGAATGG CAGTGCTGGG AACCTGATGT CGAATGGGTA 
CGTCAACCTC TCCAAGATGC GATAACCGAC CCTGACTTTT TCTCCTTTTA CCAGCCAGGC 
ATGACCTTCG AACAATTTGT ACGTGAGTTT GCCGAATGGT TTTCACAAAA ACGTCCGGCG 
GCGATGATGA TCGGCATCCG TGCGGATGAG TCCTACAACC GTTTTGTCGC CATCGCCAGT 
TTAAATAAAC AACGTTTTGC CGACGATAAA CCCTGGACTA CGGCCGCACC AGGCGGTCAT 
AGCTGGTACA TTTACCCCAT TTACGACTGG AAAGTGGCTG ATATCTGGAC CTGGTATGCA 
AATCATCAAA GTCTCTGCAA CCCACTGTAT AACCTAATGT ATCAAGCAGG CGTTCCTCTG 
CGTCATATGC GAATTTGCGA ACCTTTTGGC CCGGAGCAAC GACAAGGATT ATGGCTCTAT 
CACGTTATCG AACCGGATCG CTGGGCTGCT ATGTGCGCAC GAGTCAGCGG GGTAAAAAGT 
GGCGGCATTT ACGCCGGACA TGACAATCAT TTCTATGGGC ATCGGAAAAT CCTCAAGCCA 
GAACATTTAG ACTGGCAAGA ATATGCATTA TTGCTGCTCA ATAGCATGCC GGAAAAAACA 
GCTGAGCATT ACCGCAATAA AATCGCCATT TATTTGCACT GGTATCAGAA AAAAGGCATC 
GAGGTTCCAC AAACCCAGCA AGGGGACATT GGCGCGAAAG ATATCCCCTC CTGGCGGCGG 
ATATGCAAAG TTTTACTCAA TAACGATTAC TGGTGTCGGG CATTATCATT TAGCCCCACA 
AAATCGAAGA ACTATCAGCG TTATAACGAA CGGATAAAAG GAAAACGTCA GGAATGGGGG 
ATACTATGCA ACAACGATTA A

Protein sequence

MSIYKIPLPL NILEAARERI TWTLNTLPRV CVSFSGGKDS GLMLHLTAEL ARQMGKKICV 
LFIDWEAQFS CTINYVQSLR ELYTDVIEEF YWVALPLTTQ NSLSQYQPEW QCWEPDVEWV 
RQPLQDAITD PDFFSFYQPG MTFEQFVREF AEWFSQKRPA AMMIGIRADE SYNRFVAIAS 
LNKQRFADDK PWTTAAPGGH SWYIYPIYDW KVADIWTWYA NHQSLCNPLY NLMYQAGVPL 
RHMRICEPFG PEQRQGLWLY HVIEPDRWAA MCARVSGVKS GGIYAGHDNH FYGHRKILKP 
EHLDWQEYAL LLLNSMPEKT AEHYRNKIAI YLHWYQKKGI EVPQTQQGDI GAKDIPSWRR 
ICKVLLNNDY WCRALSFSPT KSKNYQRYNE RIKGKRQEWG ILCNND