Gene Smed_4759 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4759
Symbol
ID	5318483
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	1279527
End bp	1280648
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	65%
IMG OID	640776557
Product	cytochrome c class I protein
Protein accession	YP_001313489
Protein GI	150376893
COG category	[C] Energy production and conversion
COG ID	[COG2863] Cytochrome c553
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.880991
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.0494649
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGACCTGA GAAACCTGCA CTGGACGAAC ATCGCGAAGG TTGCGGGGCT CGGCACCGGG 
CTCCTTATCG TCCTCGGCGC CGTGTTCGTC TGGTCCGGCA TCTACAACGT CGCCGCATCG 
AAGGACCATC TGCAGATCAC GACCTGGATC TTGACGCTGA TCCGTGAACG ATCGATCGCC 
ACCCACAGTT TCAAGATCGA GGTGCCGGCG CTCGATGACG AGAGCAAGAT CCGGCTCGGG 
GCGTCTCACT ACGAGGGCGG ATGCGTGCCG TGCCATAACC GCCCCGGCGA AGAGATAAAC 
TCCATAGTCA AAGGCATGCT GCCACCGCCA CCCAACCTGC TGGAAATCGG CAAGCATCGC 
CCGCCCGAGG AGATCTTCTG GATCGTAAAG CACGGCCTCA AATACACGGG CATGCCGGCA 
TGGACGAATG TGTTACGCGA CGATGAGGTT TGGGCCCTTA CCGCGTTTCT CGCGAGCCTG 
CCGGCCACGG CTGGCGATTA CGGCGAGCTC GCAGGTCTTT CGCGCGGTCA GGGCAATGCG 
CGTGAGGAAC CGGCGAACGG GCGTGCCCTC AACGTCTGCG TGCGCTGCCA TGAACGCGAT 
GGCATGAGCA CCAACGGCGA CCGTGTGCCG CGGCTCGCGG GCATGCCGGA GGCTTATCTT 
CTTCGCAGTC TCCAGGAATA TGCACAAGGG ACACGCGCAA GCGGTGTCAT GGAACCGGTC 
GCCGACCTGC TCTCCGAGGA GGCAATGCGG GAGCTGGCGG CGCATTATCA GGCGCTTCCG 
CCTGTCGCCG GAACGGCCGA ACCAGATCCG GAGCAGCTCC GGCGGGGCGA GGCCATCGCC 
AGGCGCGGCA TAGTGGGCCA AGGCGTGCCG GCCTGTCTAA GCTGCCATTC CGGGCGTCAG 
TCGCAGCAGT TCCCGGTGCT CGCCGGACAG AATGCCGCCT ACATCGAGGA GCAGATACGG 
CTCTGGCGTC GCGGTGGGCG GATCGGAACC CCCTATGGAA GGATTATGGC GGCAGTCGCC 
GGGGCTCTCG ACGAAGGACA GATCGAGGAT GTCGCCGCCT ACCTTGCCTC ACTTCCCGCG 
GGACGCGCGC CGGACGCGCC GGTGGCGGAG GCTGGCCGAT GA

Protein sequence

MDLRNLHWTN IAKVAGLGTG LLIVLGAVFV WSGIYNVAAS KDHLQITTWI LTLIRERSIA 
THSFKIEVPA LDDESKIRLG ASHYEGGCVP CHNRPGEEIN SIVKGMLPPP PNLLEIGKHR 
PPEEIFWIVK HGLKYTGMPA WTNVLRDDEV WALTAFLASL PATAGDYGEL AGLSRGQGNA 
REEPANGRAL NVCVRCHERD GMSTNGDRVP RLAGMPEAYL LRSLQEYAQG TRASGVMEPV 
ADLLSEEAMR ELAAHYQALP PVAGTAEPDP EQLRRGEAIA RRGIVGQGVP ACLSCHSGRQ 
SQQFPVLAGQ NAAYIEEQIR LWRRGGRIGT PYGRIMAAVA GALDEGQIED VAAYLASLPA 
GRAPDAPVAE AGR