Gene Smed_3134 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3134
Symbol
ID	5324013
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	3283841
End bp	3285031
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	62%
IMG OID	640792084
Product	major facilitator transporter
Protein accession	YP_001328795
Protein GI	150398328
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0738] Fucose permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	56
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATCAGC GCACAGATTC CGCCCCGCAG GCCATTGGCC GGCAAGGATA TATGTCCAGG 
AACCGGCTCG CCGTGTCTCT CCTGTTTCTT ATGAACGGCT TCGTCACGGG TAGTTGGGCG 
CCCAAGATAC CGGAGTTCAA GGAGCGCCTC GGCATAGGCG AAAGCGTCCT CGGACTTCTC 
ATCCTGGGAT TCGGCGTCGG TTCGCTGGTG CTGATGCCGA TCGCAGGCGG CTTTATCGCC 
CGCCTCGGTT CGCAAAAGGT CGTCAAGGTC ACGGCCATAA TCCTTTCACC GCTGCTTCTC 
CTTCTGACGC TCCTGCCCAA TCTGTGGACG GCCGCGCTTG GTTTGTTCCT GCTCGGTGGC 
TTCGTGGGCG CAATGGACGT GGCCATGAAC GCCAATGCCG TCGAGGTCGA AAAGTCGATG 
CGGCGCGCCA TCATGTCATC GTGTCATGCC TATTGGAGCC TTGGCGGGTT GATCGGCGCG 
GGGATCGGCG GCTTCCTGAT GGCACGTTTC GGCGTGCTGC CGCATGCGAT GGTCGTTACC 
GTTCTCTGTC TCGTTATTCT CGCCGTTGCC TGGCCGATGA TCCTCGCCGA CCGGCCGCAT 
CTGGCGGAAA GCCGGGAAAA GCTCCGCTTG CCGATGACGC CGCTGCCCTG GCTGATCGGC 
ATCATGGCGC TTTTCTCGAT GGTGCCCGAG GGAGCCGTCC TCGATTGGGG GGCGCTCTAT 
CTCAAGAATG AACTCGGCGC ATCCGTCGAA CTTTCAGGCT TTGGCTTTGC CGCCTTCTCG 
GCCACCATGG CGGCCATGCG CTTTGCCGGC GATCACGTGC GCGACCGGTT CGGAGCGAAG 
CGGACCCTGC GCATCTCCAC CGTGACGGCG CTCGCCGGCA TGGTGCTCGC CGGCCTCGCC 
CCCAATGCCG TTCTTGCTAT CCTCGGTTTT GCGCTTGCAG GCGTGGGGAT ATCCAACATG 
GTTCCGATCG CTTTCTCCGC GGCCGGCAAC ATGCCGGGCC TGCAGCCAGG AATAGGGCTG 
TCGGTCGCCA CCACGATGGG TTATTCCGGC ATGCTGTTTG CGCCCTCCTT GATCGGCTTC 
ATCGCGGAAC ACAGCGGTTT TGCCATCGTT TTCGCATGCG TTCCCGTGCT CTTCATCGTC 
GTGCTCCTGC TCTCGCACCA CGCCGTACAC GCGGATCACG CCAAGGGGTA G

Protein sequence

MDQRTDSAPQ AIGRQGYMSR NRLAVSLLFL MNGFVTGSWA PKIPEFKERL GIGESVLGLL 
ILGFGVGSLV LMPIAGGFIA RLGSQKVVKV TAIILSPLLL LLTLLPNLWT AALGLFLLGG 
FVGAMDVAMN ANAVEVEKSM RRAIMSSCHA YWSLGGLIGA GIGGFLMARF GVLPHAMVVT 
VLCLVILAVA WPMILADRPH LAESREKLRL PMTPLPWLIG IMALFSMVPE GAVLDWGALY 
LKNELGASVE LSGFGFAAFS ATMAAMRFAG DHVRDRFGAK RTLRISTVTA LAGMVLAGLA 
PNAVLAILGF ALAGVGISNM VPIAFSAAGN MPGLQPGIGL SVATTMGYSG MLFAPSLIGF 
IAEHSGFAIV FACVPVLFIV VLLLSHHAVH ADHAKG