Gene EcE24377A_3066 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_3066
Symbol	cysJ
ID	5587243
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	3069017
End bp	3070816
Gene Length	1800 bp
Protein Length	599 aa
Translation table	11
GC content	56%
IMG OID	640926710
Product	sulfite reductase subunit alpha
Protein accession	YP_001464086
Protein GI	157158512
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0369] Sulfite reductase, alpha subunit (flavoprotein)
TIGRFAM ID	[TIGR01931] sulfite reductase [NADPH] flavoprotein, alpha-component

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.944096
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGACAC AGGTCCCACC TTCCGCGTTG CTTCCGTTGA ACCCGGAGCA ACTGGCACGC 
CTTCAGGCGG CCACGACCGA TTTAACTCCC ACCCAGCTTG CCTGGGTTTC TGGCTATTTC 
TGGGGCGTGC TCAATCAGCA GCCTGCTGCG CTTGCAGCGA CGCCAGCGCC AGCCGCAGAA 
ATGCCGGGTA TAACTATTAT CTCCGCCTCG CAAACCGGCA ATGCGCGCCG GGTTGCTGAA 
GCATTACGCG ATGATTTATT AGCAGCAAAA CTGAACGTTA AGCTGGTGAA CGCGGGCGAC 
TATAAATTCA AACAAATCGC CAGCGAAAAA CTGCTCATCG TAGTGACGTC AACGCAAGGG 
GAAGGGGAAC CGCCGGAGGA AGCCGTCGCG CTGCATAAGT TCCTGTTCTC CAAAAAAGCG 
CCAAAGCTGG AAAACACCGC GTTTGCCGTG TTTAGCCTCG GCGATAGCTC TTATGAATTT 
TTCTGCCAGT CCGGGAAAGA TTTCGACAGC AAGCTGGCGG AACTGGGTGG TGAACGCCTG 
CTCGACCGTG TCGATGCCGA TGTTGAATAC CAGGCTGCTG CCAGCGAGTG GCGCGCCCGC 
GTGGTTGATG CGCTTAAATC GCGTGCGCCT GTCGCGGCAC CTTCGCAATC CGTCGCTACT 
GGCGCGGTAA ATGAAATCCA CACCAGCCCG TACAGCAAAG ACGCGCCGCT GGTGGCTAGC 
CTCTCTGTTA ACCAGAAAAT TACCGGGCGT AACTCTGAAA AAGACGTTCG CCATATCGAA 
ATTGACTTAG GTGACTCGGG CCTGCGTTAC CAGCCGGGTG ACGCGCTGGG CGTCTGGTAT 
CAGAACGATC CGGCACTGGT GAAAGAACTT GTCGAACTGC TGTGGCTGAA AGGCGATGAA 
CCTGTCACCG TCGAGGGCAA AACGTTGCCT CTGAACGAAG CGCTACAGTG GCACTTCGAA 
CTGACCGTCA ACACCGCCAA CATTGTTGAG AATTACGCCA CGCTTACCCG CAGCGAAACA 
CTGCTGCCGC TGGTGGGCGA TAAAGCGAAG TTACAGCATT ACGCCGCGAC GACGCCGATT 
GTCGACATGG TGCGTTTCTC TCCGGCGCAA CTGGATGCCG AAGCGCTGAT TAATCTGCTG 
CGCCCGCTGA CCCCGCGCCT GTATTCCATC GCCTCCTCGC AGGCGGAAGT CGAGAACGAA 
GTACACGTCA CCGTTGGTGT GGTGCGTTAC GACGTGGAAG GCCGAGCCCG TGCCGGTGGT 
GCCTCCAGCT TCCTCGCGGA TCGCGTGGAA GAAGAGGGCG AAGTCCGCGT ATTTATCGAA 
CATAACGATA ACTTTCGCCT GCCCGCTAAC CCGGAAACCC CGGTGATTAT GATTGGCCCA 
GGCACCGGTA TTGCGCCGTT CCGCGCCTTT ATGCAGCAAC GCGCCGCCGA CGAAGCGCCA 
GGTAAAAACT GGCTGTTCTT TGGTAATCCG CACTTTACGG AAGACTTCCT GTATCAGGTG 
GAGTGGCAGC GCTACGTCAA AGATGGCGTG CTGACACGTA TCGATCTTGC CTGGTCGCGC 
GACCAAAAAG AAAAAGTTTA CGTACAAGAC AAACTGCGCG AACAGGGCGC GGAGCTGTGG 
CGCTGGATCA ATGATGGTGC CCACATTTAT GTCTGCGGCG ACGCTAATCG CATGGCGAAA 
GACGTTGAGC AGGCACTTCT GGAAGTGATT GCCGAATTTG GTGGCATGGA CACCGAAGCG 
GCGGATGAAT TTTTAAGTGA GCTGCGCGTA GAGCGCCGTT ATCAGCGAGA TGTCTACTAA

Protein sequence

MTTQVPPSAL LPLNPEQLAR LQAATTDLTP TQLAWVSGYF WGVLNQQPAA LAATPAPAAE 
MPGITIISAS QTGNARRVAE ALRDDLLAAK LNVKLVNAGD YKFKQIASEK LLIVVTSTQG 
EGEPPEEAVA LHKFLFSKKA PKLENTAFAV FSLGDSSYEF FCQSGKDFDS KLAELGGERL 
LDRVDADVEY QAAASEWRAR VVDALKSRAP VAAPSQSVAT GAVNEIHTSP YSKDAPLVAS 
LSVNQKITGR NSEKDVRHIE IDLGDSGLRY QPGDALGVWY QNDPALVKEL VELLWLKGDE 
PVTVEGKTLP LNEALQWHFE LTVNTANIVE NYATLTRSET LLPLVGDKAK LQHYAATTPI 
VDMVRFSPAQ LDAEALINLL RPLTPRLYSI ASSQAEVENE VHVTVGVVRY DVEGRARAGG 
ASSFLADRVE EEGEVRVFIE HNDNFRLPAN PETPVIMIGP GTGIAPFRAF MQQRAADEAP 
GKNWLFFGNP HFTEDFLYQV EWQRYVKDGV LTRIDLAWSR DQKEKVYVQD KLREQGAELW 
RWINDGAHIY VCGDANRMAK DVEQALLEVI AEFGGMDTEA ADEFLSELRV ERRYQRDVY