Gene EcolC_3041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3041
Symbol
ID	6066080
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	3320667
End bp	3321887
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	48%
IMG OID	641602457
Product	phosphoadenosine phosphosulfate reductase
Protein accession	YP_001725992
Protein GI	170021038
COG category	[R] General function prediction only
COG ID	[COG3969] Predicted phosphoadenosine phosphosulfate sulfotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTATTT ATAAAATTCC TCTTCCGCTC AATATTCTGG AAGCTGCACG AGAGCGTATT 
ACCTGGACAC TCAACACCCT ACCCCGCGTT TGTGTCTCAT TTTCTGGCGG CAAAGACTCT 
GGTTTAATGC TGCATCTGAC AGCCGAACTT GCCCGACAAA TGGGCAAAAA AATCTGCGTT 
TTGTTTATCG ACTGGGAGGC GCAATTCTCT TGCACCATTA ACTATGTTCA GTCCCTGCGC 
GAGTTGTACA CCGATGTCAT CGAAGAGTTT TACTGGGTTG CGCTCCCGCT TACGACGCAA 
AATTCCCTTT CACAATACCA ACCCGAATGG CAGTGCTGGG AACCTGATGT CGAATGGGTA 
CGTCAACCTC CCCAAGATGC GATAACCGAC CCTGACTTTT TCTCCTTTTA CCAGCCAGGC 
ATGACCTTCG AACAATTTGT ACGTGAGTTT GCCGAATGGT TTTCACAAAA ACGTCCGGCG 
GCGATGATGA TCGGCATCCG TGCGGATGAG TCCTACAACC GTTTTGTCGC CATCGCCAGT 
TTAAATAAAC AACGTTTTGC CGACGATAAA CCCTGGACTA CGGCCGCACC AGGCGGTCAT 
AGCTGGTACA TTTACCCCAT TTACGACTGG AAAGTGGCTG ATATCTGGAC CTGGTATGCA 
AATCATCAAA GTCTCTGCAA CCCACTGTAT AACCTAATGT ATCAGGCAGG CGTTCCTCTG 
CGTCATATGC GAATTTGCGA ACCTTTTGGC CCGGAGCAAC GACAAGGATT ATGGCTCTAT 
CACGTTATCG AACCGGATCG CTGGGCTGCT ATGTGCGCAC GAGTCAGCGG GGTAAAAAGT 
GGCGGCATTT ACGCCGGACA TGACAATCAT TTCTATGGGC ATCGGAAAAT CCTCAAGCCA 
GAACATTTAG ACTGGCAAGA ATATGCATTA TTGCTGCTCA ATAGCATGCC GGAAAAAACA 
GCTGAGCATT ACCGCAATAA AATCGCCATT TATTTGCACT GGTATCAGAA AAAAGGCATC 
GAGGTTCCAC AAACCCAGCA AGGGGACATT GGCGCGAAAG ATATCCCCTC CTGGCGGCGG 
ATATGCAAAG TTTTACTCAA TAACGATTAC TGGTGTCGGG CATTATCATT TAGCCCCACA 
AAATCGAAGA ACTATCAGCG TTATAACGAA CGGATAAAAG GAAAACGTCA GGAATGGGGG 
ATACTATGCA ACAACGATTA A

Protein sequence

MSIYKIPLPL NILEAARERI TWTLNTLPRV CVSFSGGKDS GLMLHLTAEL ARQMGKKICV 
LFIDWEAQFS CTINYVQSLR ELYTDVIEEF YWVALPLTTQ NSLSQYQPEW QCWEPDVEWV 
RQPPQDAITD PDFFSFYQPG MTFEQFVREF AEWFSQKRPA AMMIGIRADE SYNRFVAIAS 
LNKQRFADDK PWTTAAPGGH SWYIYPIYDW KVADIWTWYA NHQSLCNPLY NLMYQAGVPL 
RHMRICEPFG PEQRQGLWLY HVIEPDRWAA MCARVSGVKS GGIYAGHDNH FYGHRKILKP 
EHLDWQEYAL LLLNSMPEKT AEHYRNKIAI YLHWYQKKGI EVPQTQQGDI GAKDIPSWRR 
ICKVLLNNDY WCRALSFSPT KSKNYQRYNE RIKGKRQEWG ILCNND