Gene Smed_1101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_1101
Symbol
ID	5321947
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	1170698
End bp	1172371
Gene Length	1674 bp
Protein Length	557 aa
Translation table	11
GC content	61%
IMG OID	640790042
Product	nitrite/sulfite reductase hemoprotein beta subunit
Protein accession	YP_001326787
Protein GI	150396320
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0155] Sulfite reductase, beta subunit (hemoprotein)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.251663
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTATCGTT ACGACGAATT CGACCACACC TTCGTTTCCG CACGCGTCGA GCAGTTTCGC 
GACCAGGTCC AGCGGCGGCT GTCCGGCGAA CTCGCTGAGG ATGCGTTCAA GCCGCTGCGC 
CTGATGAACG GCGTCTATCT GCAGCTCCAT GCCTACATGC TCCGCGTCGC AATTCCCTAT 
GGGACCTTGT CGAGCCGACA GATGCGGATG CTCGCCCATA TCGCCCGCAA ATATGACCGC 
GGCTACGGAC ATTTCACCAC CCGGCAGAAC ATTCAGTACA ACTGGCCGCG CCTTTCGGAT 
ACGCCTGATA TCCTCCAGGA ACTGGCAAGC GTCGAAATGC ATGCGCTGCA GACATCCGGC 
AATTGCATTC GCAACGTCAC GGCGGACCAT TTCGCCGGTG CGGCCGCCGA CGAAGTTGCC 
GACCCGCGTC CCTATGCGGA AATCCTCAGG CAGTGGTCGA GCGTCCATCC GGAATTCTCC 
TTCCTGCCGC GCAAGTTCAA GATCGCGGTC ACGGGCGCCG AGCGCGACCG TGCCGCCATC 
CAGGTGCATG ACATCGGCCT TCACCTGAAA AAGGATGAGA ACGGCAGGCT CGGTTTCGTC 
GTCTATGTCG GCGGCGGGCA GGGCCGCACT CCGATGATCG CCAAGAAGAT CCGCGACTTC 
CTTCCGGAAG AGGACCTGCT ATCCTACACG ACCGCGATCA TGCGCGTTTA CAATCTCCAT 
GGCCGCCGTG ACAACAAGTA CAAGGCGCGC ATCAAGATTC TGGTTCATGA AACGGGTGCC 
GAGGAACTGG CGCGCCAGGT GGAGGCAGAG TTCGCCAATC TGAAGGACAC GGAACTGAAG 
CTGCCGGATT CGGATATCCA GGCGATTGCC GCCTATTTCG CCCCTGCAAC GTTGCCGAAC 
CGGCCGGAAG GCTGGGGCAA CCTCGCCCGC TGGAAGAAGG CCGATCCGGA GTTTGCCCGT 
TGGGTGCACC AGAACGTCCA GCCGCACAAG CATCCCGATT ACGGCATGGT GACGATCTCG 
CTGAAGCCGA TCGGCGGCAT TCCGGGGGAC GCCAGCGACG AGCAGATGGA TATTGTCGCA 
GAAATCGCCG AGGAATATGC GTTCGACGAG ATCCGCGTCA GCCATGAGCA GAATCTGATC 
CTCCCGCATG TGGCGCTTGC CGATCTGGAG CCGGTCTACA GAGCCCTGGT CGCTGCCGGC 
CTCGCCACCG CCAATGCAGG TCTGATAACC GATATCATTG CCTGTCCCGG GCTCGATTAT 
TGCGCGCTCG CCAATGCGCG TTCGATTCCG GTCGCGCAGG AGATTTCGAA CCGTTTCGGT 
TCGGCGGAGC GGCAGGCTGA AATCGGCGAA CTGAAGATCA AGATTTCCGG CTGCATCAAT 
GCCTGCGGGC ATCATCACGT CGGCCATATC GGTCTTCTGG GTGTGGAGAA GAAGGGCGAG 
GAGCTTTACC AGATCACGCT CGGCGGTTCC GGCGACGAAC ACACCTCGAT CGGCGAGATC 
ATCGGTCGCG GCTTCGAGCC GGAAAAGGTC ACCGACGCGG TCGAGAGGAT CGTCGACACC 
TATCTCGGGC TGCGCCGGGA CAAGTCGGAA ACGTTTCTCG AAGCCTACCG TCGTGTGGGG 
CCGCAGCCAT TCAAGGATGC GCTCTATGGC GGCGGTGCCC AGGCAGCCGC GTGA

Protein sequence

MYRYDEFDHT FVSARVEQFR DQVQRRLSGE LAEDAFKPLR LMNGVYLQLH AYMLRVAIPY 
GTLSSRQMRM LAHIARKYDR GYGHFTTRQN IQYNWPRLSD TPDILQELAS VEMHALQTSG 
NCIRNVTADH FAGAAADEVA DPRPYAEILR QWSSVHPEFS FLPRKFKIAV TGAERDRAAI 
QVHDIGLHLK KDENGRLGFV VYVGGGQGRT PMIAKKIRDF LPEEDLLSYT TAIMRVYNLH 
GRRDNKYKAR IKILVHETGA EELARQVEAE FANLKDTELK LPDSDIQAIA AYFAPATLPN 
RPEGWGNLAR WKKADPEFAR WVHQNVQPHK HPDYGMVTIS LKPIGGIPGD ASDEQMDIVA 
EIAEEYAFDE IRVSHEQNLI LPHVALADLE PVYRALVAAG LATANAGLIT DIIACPGLDY 
CALANARSIP VAQEISNRFG SAERQAEIGE LKIKISGCIN ACGHHHVGHI GLLGVEKKGE 
ELYQITLGGS GDEHTSIGEI IGRGFEPEKV TDAVERIVDT YLGLRRDKSE TFLEAYRRVG 
PQPFKDALYG GGAQAAA