Gene Smed_1540 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_1540
Symbol
ID	5322398
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	1631680
End bp	1632960
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	58%
IMG OID	640790485
Product	cytochrome b/b6 domain-containing protein
Protein accession	YP_001327217
Protein GI	150396750
COG category	[C] Energy production and conversion
COG ID	[COG1290] Cytochrome b subunit of the bc complex
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.309418
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.652412
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGCTG ATCATTCAAC CTACACGCCA ACGACAGGCA TCGAGAAGTG GGTTGATTCC 
CGCCTTCCGT TGCCGCGGCT CGTCCACGAC TCGTTCGTCT CCTATCCGGT TCCGCGCAAC 
CTGAATTATG CTTACACCTT CGGTGCGATG CTTTCGGTGA TGTTGATCGT GCAGATCCTC 
ACCGGCATCG TGCTGGCCAT GCACTATGCC GCAGAAACCT CCGTCGCCTT CAATTCGGTC 
GAGAAGATCA TGCGCGACGT CAATCATGGC TGGCTGCTGC GCTACCTGCA TGCCAACGGT 
GCGTCGTTCT TCTTCATTGC GGTCTACCTT CACATCGCCC GCGGCCTCTA TTACGGCTCC 
TACAAGGCGC CGCGCGAGAT CCTCTGGATA CTCGGCGTGG TCATCTATCT CCTGATGATG 
GCGACAGGCT TCATGGGCTA TGTGCTCCCC TGGGGGCAGA TGTCTTTCTG GGGTGCCACC 
GTCATCACCG GGTTCTTCTC GGCCTTTCCG CTTATCGGAG AGTGGATCCA GCAGTTCCTG 
CTCGGCGGCT TCGCCGTAGA CCAGCCGACG CTGAACCGGT TCTTCTCGCT GCATTACCTT 
TTGCCGTTCA TGATCGCCGG CGTGGTCGTC CTGCACATCT GGGCGCTGCA CGTCACCGGT 
CAAACGAATC CGACTGGGGT CGAGGTCAAG TCCAAGACCG ATACCGTGCC GTTCACGCCC 
TATGCGACGC TGAAGGATGC ACTGGGCGTA TCGGTCTTCC TGATCGTCTA TGCATGGTTC 
GTCTTCTATA TGCCGAACTT CCTCGGTCAC CCGGACAACT ACATCCCCGC TGATGCGTTG 
AAGACGCCCG CACACATCGT TCCGGAATGG TACTACCTGC CGTTCTACGC GATGCTGCGC 
GCCATCACCT TCAATGTCGG CCCGATCGAC TCCAAGCTCG GCGGCGTTCT GGTGATGTTC 
GGCTCGATCA TCATCCTGTT CTTCCTGCCT TGGCTCGATA CGTCGAAGGT CCGCTCGGCC 
GTGTACCGCC CCTGGTATAA GCTGTGCTTC TGGATCTTCG TTGCTAACTG CATCATGCTC 
GGCTGGTTGG GCTCGCGCCC CGCGGAAGGC CTCTATGTCG TGATGTCGCA GCTCGGCACG 
TTGTACTACT TCGCCTTCTT CCTCGTCATC ATGCCGGTCC TCGGTCTGAT CGAGACGCCG 
AAGCGCATTC CGAATTCCAT CACCGAAGCG GTCTTGGAAA AACAGAATGC CAAGGCGCAG 
TTGAAGCCCG CACGCGCCTG A

Protein sequence

MSADHSTYTP TTGIEKWVDS RLPLPRLVHD SFVSYPVPRN LNYAYTFGAM LSVMLIVQIL 
TGIVLAMHYA AETSVAFNSV EKIMRDVNHG WLLRYLHANG ASFFFIAVYL HIARGLYYGS 
YKAPREILWI LGVVIYLLMM ATGFMGYVLP WGQMSFWGAT VITGFFSAFP LIGEWIQQFL 
LGGFAVDQPT LNRFFSLHYL LPFMIAGVVV LHIWALHVTG QTNPTGVEVK SKTDTVPFTP 
YATLKDALGV SVFLIVYAWF VFYMPNFLGH PDNYIPADAL KTPAHIVPEW YYLPFYAMLR 
AITFNVGPID SKLGGVLVMF GSIIILFFLP WLDTSKVRSA VYRPWYKLCF WIFVANCIML 
GWLGSRPAEG LYVVMSQLGT LYYFAFFLVI MPVLGLIETP KRIPNSITEA VLEKQNAKAQ 
LKPARA