Gene Smed_3638 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3638
Symbol
ID	5318180
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	-
Start bp	72174
End bp	73700
Gene Length	1527 bp
Protein Length	508 aa
Translation table	11
GC content	62%
IMG OID	640775451
Product	ABC transporter related
Protein accession	YP_001312384
Protein GI	150375788
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1129] ABC-type sugar transport system, ATPase component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCCACG GTAGCATGCA TCAGTCGGCA AGCGCGGCAC GTACGGACCA GCCGCTTCTG 
TCTCTCCGAA ACATCAATAT GACCTTCGGC GGCGTCAAGG CGCTTAAGAA TGTGACCTTC 
GAGGTCCGAC CAGGCGAGGT GCATTGCCTC GCCGGTGAGA ACGGCTCCGG CAAGAGCACG 
CTGATCAAGG TGATCACGGG CGTCTATCGG CCAGCGGAAG GGGCGATCAT CGAATATGAC 
GGTGATGTCT ATCCGCATAT GTCGCCGGTC ACCGCGCAAG AGCGCGGCAT TCAGGTCATC 
TGGCAGGACC TTGCACTTTT CCCGGAAATG AGCGTCGCGG AGAACATAGC GTTCCACGAA 
GTCCTTGGCC GTCCGCGGCT GGTCGATTAC AGCCGCATGC GCCAGATTGC GATCGAAGCG 
CTGAGCCGGC TCGGCATCAC GCTCGATGTG GATCTGCCGC TCAAGGAATA TGCGATCGCC 
CAGCGTCAGA TCGTGGCGAT CGCCCGAGCG CTCGTCGGTG AGGCGAAAGT TGTCTTCATG 
GATGAGCCGA CGGCGTCGCT GACGCAGTCG GAGACGGATT ATCTCCTCGA GATCGTTCGC 
GGCCTGTCGG CCTCCGGCGT TGCGGTTGTC TTCGTCAGCC ATCGTCTGGC GGAGGTTCTT 
GAGATTTCGA GCCGGATCAC CGTTCTGCGC GACGGTGCGC TTGTCGGCGT GTATCCCGCC 
GACGGCATGA CGCAGTCGAA AATCACTGAA CTCATGACCG GCAAGACCTT CGATCAGCAC 
GTGCGCGCAC GCGCGAAGGA CGACCAGCCG GTCGTGCTCG ACGTTCGCGG TCTTGGCAGT 
CCGGGCCAGT TCGAAGATGT TTCACTGACC GTCCGCCGTG GTGAGACGGT GGGGATAACC 
GGTCTCCTGG GGGCCGGGCG GACCGAATTG GCGCTCGCGC TTTTCGGCAT GCTGAAGCCT 
ACATCTGGGA CGTTCAGCAT CGATGGCCGG GAGGCTCGCT TCGCTTCGAA CCGCGATGCG 
ATCAAGGCCG GCGTCGCCTA TCTGTCGGAG GACCGATTAT CGCTCGGGCT CATTCAGCCG 
CAGTCGATCG CCGACAATCT CGTGATCGCA TCGCTTCACA AGATTCTCTC CGGCGGCCTT 
CTCGCCGATG ACCGTAAACG CAGCCTCGTC GCCCGCTGGA TCGCCGATCT CGGCGTCAAG 
ATCGGCCATC AGGCCGACGC GATATCGACG CTTTCCGGCG GCAACCAGCA GCGGGTGGCG 
ATCGCCAAAT GGCTGGCCAC CGATCCCAAG CTTTTGATCC TCGACTCCCC CACGGTCGGG 
GTCGATGTCG GGGCGCGTGC CGGTATCTTC GACATCGTCG CCAAGCTCGC CGAGAGCGGG 
CTTGCGATTA TTCTGATCTC GGACGAAGTG CCGGAAGTCT ACTTCAATGC CGACCGGGTG 
CTGCACATGG CCCAGGGCCG CATCGTCGGC ATCTATGATC CCCACCAGAC GCGGTTGGAA 
GAGATAGAGG CGGCCGTCTA TGCATAG

Protein sequence

MGHGSMHQSA SAARTDQPLL SLRNINMTFG GVKALKNVTF EVRPGEVHCL AGENGSGKST 
LIKVITGVYR PAEGAIIEYD GDVYPHMSPV TAQERGIQVI WQDLALFPEM SVAENIAFHE 
VLGRPRLVDY SRMRQIAIEA LSRLGITLDV DLPLKEYAIA QRQIVAIARA LVGEAKVVFM 
DEPTASLTQS ETDYLLEIVR GLSASGVAVV FVSHRLAEVL EISSRITVLR DGALVGVYPA 
DGMTQSKITE LMTGKTFDQH VRARAKDDQP VVLDVRGLGS PGQFEDVSLT VRRGETVGIT 
GLLGAGRTEL ALALFGMLKP TSGTFSIDGR EARFASNRDA IKAGVAYLSE DRLSLGLIQP 
QSIADNLVIA SLHKILSGGL LADDRKRSLV ARWIADLGVK IGHQADAIST LSGGNQQRVA 
IAKWLATDPK LLILDSPTVG VDVGARAGIF DIVAKLAESG LAIILISDEV PEVYFNADRV 
LHMAQGRIVG IYDPHQTRLE EIEAAVYA