Gene EcDH1_3022 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_3022
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	3244550
End bp	3245770
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	48%
IMG OID
Product	phosphoadenosine phosphosulfate reductase
Protein accession	ACX40650
Protein GI	260450228
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	43
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTATTT ATAAAATTCC TCTTCCGCTC AATATTCTGG AAGCTGCACG AGAGCGTATT 
ACCTGGACAC TCAACACCCT ACCCCGCGTT TGTGTCTCAT TTTCTGGCGG CAAAGACTCT 
GGTTTAATGC TGCATCTGAC AGCCGAACTT GCCCGACAAA TGGGCAAAAA AATCTGCGTT 
TTGTTTATCG ACTGGGAGGC GCAATTCTCT TGCACCATTA ACTATGTTCA GTCCCTGCGC 
GAGTTGTACA CCGATGTCAT CGAAGAGTTT TACTGGGTTG CGCTCCCGCT TACGACGCAA 
AATTCCCTTT CACAATACCA ACCCGAATGG CAGTGCTGGG AACCTGATGT CGAATGGGTA 
CGTCAACCTC CCCAAGATGC GATAACCGAC CCTGACTTTT TCTGCTTTTA CCAGCCAGGC 
ATGACCTTCG AACAATTTGT ACGTGAGTTT GCCGAATGGT TTTCACAAAA ACGTCCGGCG 
GCGATGATGA TCGGCATCCG TGCGGATGAG TCCTACAACC GTTTTGTCGC CATCGCCAGT 
TTAAATAAAC AACGTTTTGC CGACGATAAA CCCTGGACTA CGGCCGCACC AGGCGGTCAT 
AGCTGGTACA TTTACCCCAT TTACGACTGG AAAGTGGCTG ATATCTGGAC CTGGTATGCA 
AATCATCAAA GTCTCTGCAA CCCACTGTAT AACCTAATGT ATCAGGCAGG CGTTCCTCTG 
CGTCATATGC GAATTTGCGA ACCTTTTGGC CCGGAGCAAC GACAAGGATT ATGGCTCTAT 
CACGTTATCG AACCGGATCG CTGGGCTGCT ATGTGCGCAC GAGTCAGCGG GGTAAAAAGT 
GGCGGCATTT ACGCCGGACA TGACAATCAT TTCTATGGGC ATCGGAAAAT CCTCAAGCCA 
GAACATTTAG ACTGGCAAGA ATATGCATTA TTGCTGCTCA ATAGCATGCC GGAAAAAACA 
GCTGAGCATT ACCGCAATAA AATCGCCATT TATTTGCACT GGTATCAGAA AAAAGGCATC 
GAGGTTCCAC AAACCCAGCA AGGGGACATT GGCGCGAAAG ATATCCCCTC CTGGCGGCGG 
ATATGCAAAG TTTTACTCAA TAACGATTAC TGGTGTCGGG CATTATCATT TAGCCCCACA 
AAATCGAAGA ACTATCAGCG TTATAACGAA CGGATAAAAG GAAAACGTCA GGAATGGGGG 
ATACTATGCA ACAACGATTA A

Protein sequence

MSIYKIPLPL NILEAARERI TWTLNTLPRV CVSFSGGKDS GLMLHLTAEL ARQMGKKICV 
LFIDWEAQFS CTINYVQSLR ELYTDVIEEF YWVALPLTTQ NSLSQYQPEW QCWEPDVEWV 
RQPPQDAITD PDFFCFYQPG MTFEQFVREF AEWFSQKRPA AMMIGIRADE SYNRFVAIAS 
LNKQRFADDK PWTTAAPGGH SWYIYPIYDW KVADIWTWYA NHQSLCNPLY NLMYQAGVPL 
RHMRICEPFG PEQRQGLWLY HVIEPDRWAA MCARVSGVKS GGIYAGHDNH FYGHRKILKP 
EHLDWQEYAL LLLNSMPEKT AEHYRNKIAI YLHWYQKKGI EVPQTQQGDI GAKDIPSWRR 
ICKVLLNNDY WCRALSFSPT KSKNYQRYNE RIKGKRQEWG ILCNND