Gene Smed_3962 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3962
Symbol
ID	5318196
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	-
Start bp	410252
End bp	411388
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	64%
IMG OID	640775771
Product	ABC transporter related
Protein accession	YP_001312704
Protein GI	150376108
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0765828
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCACGA TCAACCTGCG CGGTGCGCAG AAAAACTACG GCGTGAATTC GGCGAATGCC 
GTTTCCGATC TCGATCTGGA AATCCGCGAT GGCGAATTCA TGTGCCTGCT CGGTCCCTCG 
GGCTGCGGAA AAACCACGAC GCTCAGAATG ATTGCCGGCC TCGAAAATCT CTCGGGCGGC 
GAAATCCGCG TCGGTGACAG GGTCGTCGAC TGCGTCTCCG GCGGCGTGTT CGTGCCGCCC 
GAGAAACGGG AGATGGGCCT CGTCTTCCAG AGCTATGCCC TGTGGCCGCA CCTGACGATC 
GAGCGCAATA CGGATTTCGG CCTGAGGCTG CGCAAGCTGC CCAAAGCGGA AAGGGAAGAG 
CGCGTCGAGC GCGTCATGCA GGCGCTCGAT ATCGCCAAGT ACCGCGATCG TTATCCGTCG 
CAACTGTCCG GCGGTCAGCA GCAGCGGGTG GCGCTGGCCC GCATGCTGGC AATCAACCCC 
GGCGTGCTGT TGCTCGACGA GCCGCTTTCC AACCTCGACG CGCGGCTGCG GCTGGAAATG 
CGCGCGGAGC TCAAGCGGCT GCACAAGGAA TTCAAGACGA CCATCGTCTT TGTCACCCAT 
GACCAATGGG AGGCGATGAC GCTCGCGACG ACCATCGCCG TCATGAACGA AGGCACGCTG 
CAGCAGATAG GCACGCCAAA CGACATCTAT GATCGCCCGG CGAATCGCTT CGTCGCCGAG 
TTCGTCGGCA GCCCGCCCAT CAATATTCTC GACTTCGGCG ATCCCGGCAC ATCCGATGTG 
ACGGATAAGG CTGAGGCCTA TCTTGCCGCG CATCTTCCAG GGCTGAGGAG CATCGGCTCC 
GTCGGTATCC GCCCCGAGGC GATAGGTTAT GCCGCGCGGA CCGAGGACGT GCCGGAGGGG 
AGCTTCTCGG GCGAGACGAC GGTTACCGGC GTCCTGCCGA CGGGAGGCAA CTGGATCCTG 
GAGCTAAGGA CCGACAACCA CACCCTGTTC CTGACGACGC ATGTCCCGCC GAGGGTCGAG 
CAGGGCGCCA GGGTCCTCTT CTTTGCGCCG CCCGAGGCCC TGCATGTGTT CGATGCCGAC 
GGCCGCCGGA TCGCAGAGGC GGACGACCGG CTGAGGAGCA CCGCAACCTA CAACTGA

Protein sequence

MPTINLRGAQ KNYGVNSANA VSDLDLEIRD GEFMCLLGPS GCGKTTTLRM IAGLENLSGG 
EIRVGDRVVD CVSGGVFVPP EKREMGLVFQ SYALWPHLTI ERNTDFGLRL RKLPKAEREE 
RVERVMQALD IAKYRDRYPS QLSGGQQQRV ALARMLAINP GVLLLDEPLS NLDARLRLEM 
RAELKRLHKE FKTTIVFVTH DQWEAMTLAT TIAVMNEGTL QQIGTPNDIY DRPANRFVAE 
FVGSPPINIL DFGDPGTSDV TDKAEAYLAA HLPGLRSIGS VGIRPEAIGY AARTEDVPEG 
SFSGETTVTG VLPTGGNWIL ELRTDNHTLF LTTHVPPRVE QGARVLFFAP PEALHVFDAD 
GRRIAEADDR LRSTATYN