Gene Smed_4588 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4588
Symbol
ID	5319004
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	1083849
End bp	1085048
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	64%
IMG OID	640776389
Product	hypothetical protein
Protein accession	YP_001313321
Protein GI	150376725
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.597366
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGCAGC CGGCCGACAG GGAATTTTAC GCGAACCTTC CGCTTTTCGA GGCATTCGAA 
GGTGTCGCAG ACGAGGCCAA TTACCGGCCC CTGCCCGAAG GCTGGTGGCT TGCCGTTGCC 
GACATCGTGG ATTCGACGGG AGCCATCGCG GAAGGGCGAT ACAAGAGCGT GAACATGGCC 
GGCGCGAGCG TCATCTCCGC GCTCATGAAT GCGCTTGACG AGAAAAATCT CGCCTTCGTT 
TTCGGTGGCG ACGGTGCGCT CGCCGTCGTG CCCGGCGGGC TGGCGGCAAA GGCAAAACAC 
GCGCTCGCTG CGGCGAAAAC ATGGGTTGCG GAAGAGCTTG GACTGGAGCT TCGCGCTGCG 
ATCGTCCCGG TCTCGGACGT GCGCGCCAAT GGCTTCGACA TGCGCGTTGC GCGCTTCAAG 
GCGAGCGAGG TGGTCTCCTA TGCCATGTTC TCCGGCGGCG GCGCCAGCTG GGCGGAAGCG 
GAAATGAAGG CAGGCCGTTA TCAGATTGCG GCCGCCCCGA CCGGCACACG GCCCGACCTG 
ACCGGGTTGT CCTGCCGGTG GAACCCGATC GTCTCACATC ACGGGGCGAT CGTATCCATC 
ATCGCAGTGC CGGGAGAGCG CGGCATCGGA CCTGAATTCC AGGCTTTGAT CGGCGACATC 
GTGGAACTGG CCGAAGGGGA GGAGCGGGGT GGGCACCCCG TACCGGAAAA CGGTCCCGAG 
CCGCATCTGT CGGTGCGCGG CATCACGGTG GAATCGCGCG CCGTCGCGCC GAGAGGCCGC 
CGCTCCCTGG CTTGGTTCTT CGTCGCCGCG CAGAGCCTTG CTCTCTTTCT CTGCTTCAGG 
CTCGGCATCA ATTTCGGCCC CTTCGACGTC AAGCGATATG CGCGCGACCT TGCCAGCAAT 
TCGGACTTCC GCAAGTTTGA TGACGCTCTG AAGATGACGA TCGACGTCAG TCTCGATCGG 
CTGCGCAGAA TCGAGGAGCG GCTGAAGCAA GGGGTCGCGG CGGGCATATG CCGCTACGGA 
CTGCACCGGC AGGATGCGGC ACTGATGACG TGCATCGTAC CGACGCCGAT GAGCCGCGAC 
CACATGCACT TCATCGACGG GGCGGCCGGC GGGTACGCGG TGGCCGCCCG GAACCTGAAG 
GCCACCCTTG CCGGCAGCGT TTCACAGGCG GGAAGTCTAC CTTCGATGAT TAAGCCTTGA

Protein sequence

MVQPADREFY ANLPLFEAFE GVADEANYRP LPEGWWLAVA DIVDSTGAIA EGRYKSVNMA 
GASVISALMN ALDEKNLAFV FGGDGALAVV PGGLAAKAKH ALAAAKTWVA EELGLELRAA 
IVPVSDVRAN GFDMRVARFK ASEVVSYAMF SGGGASWAEA EMKAGRYQIA AAPTGTRPDL 
TGLSCRWNPI VSHHGAIVSI IAVPGERGIG PEFQALIGDI VELAEGEERG GHPVPENGPE 
PHLSVRGITV ESRAVAPRGR RSLAWFFVAA QSLALFLCFR LGINFGPFDV KRYARDLASN 
SDFRKFDDAL KMTIDVSLDR LRRIEERLKQ GVAAGICRYG LHRQDAALMT CIVPTPMSRD 
HMHFIDGAAG GYAVAARNLK ATLAGSVSQA GSLPSMIKP