Gene Smed_4396 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4396
Symbol
ID	5319161
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	892367
End bp	893479
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	63%
IMG OID	640776200
Product	ABC transporter related
Protein accession	YP_001313133
Protein GI	150376537
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.625138
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.658591
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTTCGG TCACCCTGAG GAATGTCAGC AAGACCTTCG GTACCTATGA CGTGATCCGG 
TCCATCGACC TCGAGATCGA GGACGGCGAA TTCGTCGTCT TCGTCGGTCC GTCCGGTTGC 
GGGAAGTCGA CGCTTTTGCG ATTGATTGCC GGTCTCGTCC CGGTTTCCGG CGGCGACGTA 
TTTATCGGTG GCGACCAGGT GACGGATGTG CCCGCTTCGA AGCGAGGACT TGCCTTCGTC 
TTCCAGTCCT ATGCGCTCTA CCCCCATATG AACGTCGCGC GGAACATCGG CTTCGCGCTC 
GAAACGGCGC GGCTCGGCAA AGACGAGATG CGGCGCCGTG TCGCGAGGGT CGCCGACATG 
CTGAAGATCG GCCATCTGCT CGAGCGGCGG CCGCGCCAGC TTTCCGGCGG TCAGCGGCAG 
CGCGTCGCGA TCGGTCGAGC GCTGGTCGGC CAGCCGGAGG TTTTCCTCTT CGATGAGCCG 
CTTTCCAATC TCGACGCGGA CCTGCGCATG GAAATGCGCT TCGAGATCGC CAAGCTGCAT 
GCCGACGTCA GGACGACGAT GATCTATGTC ACCCACGATC AGACGGAAGC GATGACGCTC 
GCCGACCGGA TCGTGATCCT CAATCACGGG AAGATCGAGC AGGTGGGGCG GCCTCGCGCG 
CTGTACGACC GGCCGGCAAA TCGCTTCGTT GCCGGGTTCC TCGGCAGTCC GAGGATGAAT 
TTCGCCCCTT TGGAGACGGC CGGTGCGGCC GTTTCGATGC TCAGGGGTGC AGGTGGCTTC 
ACCTATGCGG CCGATCTCGC TGCGGCAGAA GGAACGCCCG TCGAGCTCGG ATTGCGGCCG 
GAAAGTCTGC AGCTCGTCGG TGCGGATGTG AAGGGCGCCA TACGCGGAAC CTTCGAGCGG 
ATGGAGGATC TCGGCTACGA ATATGTCTGC TATGTGCGTC TCACCGAAAC GCTGGTCTGG 
ACGATCCGTG CGACGGGGAG CCCGCCGCAA ATCACGCCCG GCGAGCCCGT CGGCCTGACC 
TGGCAGCCGG AAAGTCTCTA CCTCTTCGGA GAGGATGGCA GGCGCATCGA CCACCGCACG 
AGCATTCCGC TGTCCCTTGG AGCGTCGTCG TGA

Protein sequence

MASVTLRNVS KTFGTYDVIR SIDLEIEDGE FVVFVGPSGC GKSTLLRLIA GLVPVSGGDV 
FIGGDQVTDV PASKRGLAFV FQSYALYPHM NVARNIGFAL ETARLGKDEM RRRVARVADM 
LKIGHLLERR PRQLSGGQRQ RVAIGRALVG QPEVFLFDEP LSNLDADLRM EMRFEIAKLH 
ADVRTTMIYV THDQTEAMTL ADRIVILNHG KIEQVGRPRA LYDRPANRFV AGFLGSPRMN 
FAPLETAGAA VSMLRGAGGF TYAADLAAAE GTPVELGLRP ESLQLVGADV KGAIRGTFER 
MEDLGYEYVC YVRLTETLVW TIRATGSPPQ ITPGEPVGLT WQPESLYLFG EDGRRIDHRT 
SIPLSLGASS