Gene EcolC_0949 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0949
Symbol
ID	6068350
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	1033300
End bp	1035012
Gene Length	1713 bp
Protein Length	570 aa
Translation table	11
GC content	56%
IMG OID	641600357
Product	sulfite reductase subunit beta
Protein accession	YP_001723945
Protein GI	170018991
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0155] Sulfite reductase, beta subunit (hemoprotein)
TIGRFAM ID	[TIGR02041] sulfite reductase (NADPH) hemoprotein, beta-component

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.395546
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGAAA AACATCCAGG GCCTTTAGTG GTCGAAGGAA AACTGACAGA CGCCGAGCGC 
ATGAAGCTTG AAAGCAACTA CCTGCGCGGC ACCATTGCGG AAGATTTAAA CGACGGCCTG 
ACCGGCGGCT TTAAGGGCGA TAACTTCCTG CTGATCCGCT TCCACGGCAT GTATCAGCAG 
GATGACCGCG ACATCCGCGC CGAACGTGCT GAACAGAAGC TGGAGCCGCG CCACGCGATG 
CTGCTTCGCT GTCGTCTGCC GGGTGGGGTG ATTACCACTA AACAGTGGCA GGCGATCGAC 
AAATTTGCCG GTGAAAACAC CATCTATGGC AGCATTCGCC TGACCAACCG CCAGACGTTT 
CAGTTCCACG GCATTCTGAA AAAGAACGTC AAACCGGTGC ACCAGATGCT GCACTCGGTT 
GGTCTTGATG CGCTGGCGAC CGCTAACGAC ATGAACCGTA ACGTACTCTG CACCTCGAAC 
CCTTACGAGT CGCAGCTACA CGCGGAAGCG TATGAATGGG CGAAGAAAAT CTCTGAACAT 
CTGCTGCCGC GTACCCGCGC GTATGCGGAG ATCTGGCTCG ATCAGGAAAA AGTCGCCACC 
ACCGATGAAG AACCGATCCT CGGTCAGACT TATTTGCCGC GTAAATTCAA AACCACGGTA 
GTGATCCCGC CGCAGAACGA TATCGATCTG CATGCCAACG ACATGAACTT CGTGGCAATC 
GCCGAAAACG GCAAGCTGGT AGGCTTTAAC CTGCTGGTGG GCGGCGGGCT TTCCATCGAA 
CACGGTAATA AGAAAACCTA CGCCCGCACG GCGAGCGAGT TTGGTTATCT GCCGCTGGAG 
CATACCCTGG CGGTGGCGGA AGCCGTCGTG ACGACTCAGC GCGATTGGGG TAACCGTACC 
GATCGTAAAA ATGCCAAAAC CAAATACACG CTGGAGCGCG TGGGTGTTGA GACATTTAAA 
GCGGAAGTGG AGCGTCGCGC GGGGATCAAA TTTGAACCGA TCCGTCCATA TGAGTTCACC 
GGACGAGGCG ATCGTATTGG CTGGGTTAAG GGCATTGATG ATAACTGGCA CCTGACGCTG 
TTTATCGAAA ATGGTCGCAT CCTTGATTAT CCGGGGCGTC CGCTGAAAAC CGGCCTGCTG 
GAGATCGCGA AGATCCACAA AGGCGATTTC CGCATTACGG CGAACCAGAA TCTGATCATC 
GCCGGTGTAC CGGAAAGCGA GAAAGCGAAG ATCGAGAAGA TCGCCAAAGA GAGCGGGTTA 
ATGAATGCCG TCACGCCGCA GCGTGAAAAC TCGATGGCCT GCGTGTCATT CCCGACTTGC 
CCGCTGGCGA TGGCGGAAGC AGAGCGTTTC CTGCCGTCTT TTATCGACAA CATCGATAAT 
TTAATGGCGA AACATGGTGT CAGCGATGAG CATATCGTGA TGCGTGTAAC AGGCTGCCCG 
AACGGTTGTG GTCGCGCGAT GCTGGCGGAA GTGGGCCTGG TGGGTAAAGC GCCGGGTCGC 
TACAACCTGC ATCTTAGCGG CAACCGCATT GGGACACGTA TCCCACGGAT GTATAAAGAA 
AACATCACCG AGCCGGAAAT CCTGGCGTCG CTTGATGAAC TGATAGGGCG CTGGGCGAAA 
GAGCGCGAAG CGGGTGAAGG CTTCGGCGAC TTTACGGTGC GTGCGGGCAT CATTCGCCCG 
GTGCTCGATC CGGCGCGCGA TTTGTGGGAT TAA

Protein sequence

MSEKHPGPLV VEGKLTDAER MKLESNYLRG TIAEDLNDGL TGGFKGDNFL LIRFHGMYQQ 
DDRDIRAERA EQKLEPRHAM LLRCRLPGGV ITTKQWQAID KFAGENTIYG SIRLTNRQTF 
QFHGILKKNV KPVHQMLHSV GLDALATAND MNRNVLCTSN PYESQLHAEA YEWAKKISEH 
LLPRTRAYAE IWLDQEKVAT TDEEPILGQT YLPRKFKTTV VIPPQNDIDL HANDMNFVAI 
AENGKLVGFN LLVGGGLSIE HGNKKTYART ASEFGYLPLE HTLAVAEAVV TTQRDWGNRT 
DRKNAKTKYT LERVGVETFK AEVERRAGIK FEPIRPYEFT GRGDRIGWVK GIDDNWHLTL 
FIENGRILDY PGRPLKTGLL EIAKIHKGDF RITANQNLII AGVPESEKAK IEKIAKESGL 
MNAVTPQREN SMACVSFPTC PLAMAEAERF LPSFIDNIDN LMAKHGVSDE HIVMRVTGCP 
NGCGRAMLAE VGLVGKAPGR YNLHLSGNRI GTRIPRMYKE NITEPEILAS LDELIGRWAK 
EREAGEGFGD FTVRAGIIRP VLDPARDLWD