Gene Smed_5234 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5234
Symbol
ID	5319536
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	-
Start bp	193726
End bp	194814
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	60%
IMG OID	640777011
Product	hypothetical protein
Protein accession	YP_001313943
Protein GI	150377348
COG category	[R] General function prediction only
COG ID	[COG0628] Predicted permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAATCAA GCTATGTCCC GGAGCTGCCA AATGCTGCCG ACAACCCTGG GAGGTGCACG 
ATGACCGAAC GCGGTAGGGT GGTCGTACCG GGCATCCTGA CTGTAATCGC CACGGTGGCG 
GCCGTGTATT TCTCCGGTGT CGTTCTCGCA CCTGTCGCAT GCGCGCTGTT TATCATTGCG 
GTGCTGTGGC CAATTCAAAG TCGGCTAGAG GCACGCCTGC ACAGGGTATT CGCATTGGCC 
ATCGTCGCGG CGCTGCTGTT CGGGACCTTT GTCGTGTTCA TGTCCGTCGT GACGTTGAGC 
TTCGGCCGGA TCGGGCGGTC GCTGGCAATG GATGCCGGTC AGTTTCAGCT GCTTTACAAT 
CGCCTTGCGG AGTGGCTAGG GGGGCACGGA ATAGCTCTCG CCGGGTTCTG GGCGGACAAC 
CTCGACTCCC GGCTCCTGTT GCGCGCCCTG CAGGGGATCT CTGCTCGGCT GAACACCATG 
GTCTCGTTCT GGCTCGTGGT TCTCCTCTAT GTCATTCTCG GGCTTTTGGA AGTGTCGGAC 
CTGGGTGCCA GAATCCGCAG GCTCACGGAC GACAACGCGG CTCGCATCAT CAGCGGCTTC 
GAACTCGCGG CCTCGCGTAT CCGACGATAT CTTCTCATCA GGACGATCAT GAGCGCGGCG 
ACCGGAATTG CCGTCTGGGC GCTTGCCACG GCCTTCGGAC TGCGGTTCGC TGCCGAATGG 
GGAATCGTCG CGTTCACCTT GAACTATATC CCGTTCATCG GCCCGGCATT CGCGACGATC 
CTGCCGACCT GTTACGCCCT GGCTCAATTC CAGTCGCCTC AGTCGGCCCT GATCGTCTTC 
GCCTGCTTGA GTACCGCCCA ATTCATAATA GGGAGCTACA TCGAGCCCAG AGTGGCTGGT 
AACACACTCG GCATATCTCC GTCGCTCGTC CTCTTCTCCG TTTTTCTCTG GACCTTCCTG 
TGGGGAATAT TCGGCGCGTT TATCGGCGTT CCGATAACCA TCGCCGTCCT TTCATTCTGC 
GCCCAGTTCG CCTCTACGCG GTGGCTTGCG GAACTGCTGG GGAAAGAGAC GATAATGGAT 
GGCGCATGA

Protein sequence

MQSSYVPELP NAADNPGRCT MTERGRVVVP GILTVIATVA AVYFSGVVLA PVACALFIIA 
VLWPIQSRLE ARLHRVFALA IVAALLFGTF VVFMSVVTLS FGRIGRSLAM DAGQFQLLYN 
RLAEWLGGHG IALAGFWADN LDSRLLLRAL QGISARLNTM VSFWLVVLLY VILGLLEVSD 
LGARIRRLTD DNAARIISGF ELAASRIRRY LLIRTIMSAA TGIAVWALAT AFGLRFAAEW 
GIVAFTLNYI PFIGPAFATI LPTCYALAQF QSPQSALIVF ACLSTAQFII GSYIEPRVAG 
NTLGISPSLV LFSVFLWTFL WGIFGAFIGV PITIAVLSFC AQFASTRWLA ELLGKETIMD 
GA