Gene Smed_5856 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5856
Symbol
ID	5320158
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	-
Start bp	817766
End bp	818962
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	62%
IMG OID	640777551
Product	hypothetical protein
Protein accession	YP_001314483
Protein GI	150377888
COG category	[S] Function unknown
COG ID	[COG5441] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.973654
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGCGCA TCTACATCGT AGGCACGGCC GACACGAAGG GGGAGGAACT CACTTATCTG 
GCGGCGCGGG TCGAGGCCGC CGGCGGCCGG CCCGTTCGCG TCGATGTCGG CACGCGTCGC 
CCCACGGTTG CGGTGGACAT CTCAGCCGAG ACAGTGGCGG CCGCGCATCC TGACGGCGTT 
GCAGCAGTGC TTTCCGGCGA TGACCGGGGG AAGGCGGTCG CTGCAATGGG TGAGGCCTTC 
GCGCGCTTCC TTCCTAAATG CGACGATGTC GCCGGCGTGG TAGGCATTGG TGGTGGGGGC 
GGCACATTAA TCATCACTGC GGGCATGCGC GGATTGCCAC TCGGTCTGCC GAAGCTCATG 
GTCTCGACGC TCGCGTCCGG CGACGTAGCA CCTTACGTTG ACGTTTCCGA CATTGTCATG 
ATGCCATCGG TCACAGACAT GGCCGGGCTC AACCGCATCA GCCGCGTGAT CTTGCAAAAC 
GCGGCGGCGG CAATTACGGC AATGGCCAGT CGGCCAACTG AGAAAGCAGC CTCCAAGCCC 
GCTCTCGGTC TTACTATGTT TGGCGTGACG ACTCCCTGCG TGACCACCAT TGTCGACAGA 
CTGAGGGCGG ATCACGATTG TCTGGTCTTC CACGCCACTG GCGCAGGCGG ACGCACGATG 
GAGAAGCTCG CAGATAGCGG GTTTCTTTCA GGCGTGCTCG ACATTACCAC GACAGAGGTT 
TGCGACTTTC TCCTTGGTGG CGTCCTTTCG GCAACGCAGG ATCGCTTCGG TGCGATTGCG 
CGCACGGGAC TGCCTTATGT CGGCTCCGTC GGTGCGTTGG ATATGGTGAA TTTCTGGGCG 
CCCGAAACCG TGCCGGAGCG CTACGCGGGG CGACTTCTCT ATCACCATAA TCCCAACGTC 
ACGCTCATGC GTACGACTCC GAGGGAGTGC GCTGCCATCG GAAGATGGAT TGGGGCCAAG 
CTCAACCTCT GCAAAGGTGT CGTTCGCTTC CTTATTCCGG AGAAGGGCGT GTCGGCCCTC 
GATGTCGAGG GGGGAGCCTT TTTCGATCCG ACAGCAGACG CGGCCCTTTT CGAGGCGCTG 
GAAGCGACTG TCGACAGGAC CGAGCGCCGC CGTATCGTCC GTCTTCCGCT TCACATCAAC 
GATCCGCAGT TTGCCGAGGC CGCAGTCGCG GCCTACCGAG AAATCGCAAA ACATTGA

Protein sequence

MQRIYIVGTA DTKGEELTYL AARVEAAGGR PVRVDVGTRR PTVAVDISAE TVAAAHPDGV 
AAVLSGDDRG KAVAAMGEAF ARFLPKCDDV AGVVGIGGGG GTLIITAGMR GLPLGLPKLM 
VSTLASGDVA PYVDVSDIVM MPSVTDMAGL NRISRVILQN AAAAITAMAS RPTEKAASKP 
ALGLTMFGVT TPCVTTIVDR LRADHDCLVF HATGAGGRTM EKLADSGFLS GVLDITTTEV 
CDFLLGGVLS ATQDRFGAIA RTGLPYVGSV GALDMVNFWA PETVPERYAG RLLYHHNPNV 
TLMRTTPREC AAIGRWIGAK LNLCKGVVRF LIPEKGVSAL DVEGGAFFDP TADAALFEAL 
EATVDRTERR RIVRLPLHIN DPQFAEAAVA AYREIAKH