Gene Smed_4645 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4645
Symbol
ID	5319290
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	1154796
End bp	1155929
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	60%
IMG OID	640776443
Product	ABC transporter related
Protein accession	YP_001313375
Protein GI	150376779
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.396966
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.0568321
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGGACAGC TCACTCTCAA CAAGGTTCAG AAATCCTACG GCACCTACGA GGTGTTGAAG 
AGCATCGAGC TCGAAGTCGG AAATGGCGAA TTCGTGGTCT TCGTCGGACC TTCCGGCTGC 
GGCAAATCAA CACTGCTCAG GATGATCGCG GGGCTTGACG AGACGACCGC GGGTGACATC 
GTCATCGATG GCAAGCGTGT TAACGATCTG CCGCCCGTCA GGCGCGGCAT AGCCATGGTC 
TTCCAGTCCT ATGCTCTATA CCCGCATATG AGCGTGTTCG AGAACATCGC CTTTCCTCTA 
CGGGTCGAGA AGATGCCCGA GGAGAAACTG AAGGCGAAGG TTCAGCATGC CGCCCGCATA 
TTGCACCTCG ATCAGCGGCT CGAGCAGAAG CCGGGCATGC TGTCGGGCGG GCAGCGTCAA 
CGTGTGGCGA TCGGCCGGGC AATCGTGCGC GAACCGAAGA TCTTCCTGTT CGACGAGCCG 
CTGTCTAACC TCGATGCTGC CTTGCGCGCC GATATGCGCA TTGAGCTCGC GAAGCTGCAC 
AGGCATTTGA AGGCGACGAT GATCTACGTC ACGCACGACC AGGTCGAGGC GATGACGATG 
GCGGACCGGA TTGTCGTGCT GAACGCCGGA GAGATTGCGC AGACGGGAGC GCCGCTCGAG 
CTTTATCACA AACCCGCAAA CATATTCGTC GCAGGATTTA TCGGAAACCC CAAGATGAAC 
TTTCTGCCGG TCACCTGTAC AGGTGTAAAC GATGCCGGTG TGGAAGTGGA CTACAAGGGA 
CAGACGATTC TCGTTCCGGT CGTACCGCGC GCGGGCATGA CCGGGCGAAC CCTGACGCTC 
GGGGTGCGGC CGGAACATAT CCGGATGGGC GACGCCGACC TGACGCTGAC GGTGACCCCC 
TCGGTCATCG AGCGTCTCGG CGCCCATACA GTGGCCTATG TGGCGCTTGA CGGGGAAGGG 
GAGAACTATT GCGCCATGCT GCCGGGGACA CTCGCGATCC GCGCCGACCA ACGGGTCAAG 
ACCGGCATCG GTGCCATCGA CTGCCACCTC TTCGACGAAA AGGGGATGGC CTTCGAGCGG 
CGGGTAGAGA TGACCGACAT CGATATGTCG CACTTCGATC CGGCGGCGGC TTGA

Protein sequence

MGQLTLNKVQ KSYGTYEVLK SIELEVGNGE FVVFVGPSGC GKSTLLRMIA GLDETTAGDI 
VIDGKRVNDL PPVRRGIAMV FQSYALYPHM SVFENIAFPL RVEKMPEEKL KAKVQHAARI 
LHLDQRLEQK PGMLSGGQRQ RVAIGRAIVR EPKIFLFDEP LSNLDAALRA DMRIELAKLH 
RHLKATMIYV THDQVEAMTM ADRIVVLNAG EIAQTGAPLE LYHKPANIFV AGFIGNPKMN 
FLPVTCTGVN DAGVEVDYKG QTILVPVVPR AGMTGRTLTL GVRPEHIRMG DADLTLTVTP 
SVIERLGAHT VAYVALDGEG ENYCAMLPGT LAIRADQRVK TGIGAIDCHL FDEKGMAFER 
RVEMTDIDMS HFDPAAA