Gene Smed_4451 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4451
Symbol
ID	5318603
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	935103
End bp	936311
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	62%
IMG OID	640776253
Product	major facilitator transporter
Protein accession	YP_001313186
Protein GI	150376590
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.915935
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCAATCG GGACCGACAC CATGACGCTG ACCTACAACG AGAACATCCA TAGCAGGCCC 
AGGGCCTGGG GCGCCGTGTT CTCCATGACA TTGTGCGTAT TCGTGCTGAT CGCTTCGGAG 
TTCATGCCCG TGAGCCTGCT GACGCCGATC GCCGCTGATC TCGGTGTTTC AGAAGGGAGT 
GCGGGCCAGG CAATCTCCAT CTCAGGCATC TTCGCGGTTT TCACCAGCCT CTTCATTGCC 
GCGCTGACCC GGCGGCTCGA TCGGCGCGTG GTCGTGCTGG CCTTGACGTT TCTGCTGATG 
CTGTCTGGGG TCGCGGTTAC CTTTGCGCCT TCCTATCCCA TGCTGATGCT GGGTCGCGCG 
CTGCTTGGAA TTTCCATCGG CGGCTTCTGG TCGATGTCCA CGTCGATCGT GATGCGTCTC 
GTCTCCCGCG ACCAGGTGCC GAAGGCACTT GCACTGCTCA ATGCGGGCAA TGCGATCGCG 
GCCACCATCT CCGCACCCCT GGGAAGTCTC CTCGGGTCCT ATATCGGGTG GCGCGGCGCC 
TTCTTTCTCG TGGTTCCCGT GGGCTTGCTT GCGCTTATCT GGCAATGGAT CAGCCTGCCG 
ACGCTTTCGC CCCGGCGCGA TGGCGCATCC CGGAACGTCC TCCGGCTGCT GGCGCGTCCA 
CCCGTCGCAT TGGGCATGGC AGCAATCCTG CTGCTGTTCA TGGGGCAGTT TGCTTTCTTC 
ACTTATCTGC GGCCGTTCCT GGAGCAGGTG ACCCACCTTG GCATCGAGAC GCTCTCGCTC 
ATGCTTCTCG TGATGGGATT GTCGGGAGTG GCCGGAACAT CGCTCGTCGG CCGGCTGCTG 
ACTCATCGCC TGTTCAGCAT TCTCATCGTC ATTCCGTTCC TCATGGCCTG TATCGCTTTG 
GCAATGATTG GCATCGGTGA GATGAGGACC CCTGTCGTCA TGTCCCTCAT CGGTTGGGGT 
TTTCTCGGGA CCGCAGCGCC GGTGGCCTGG GGCACCTGGC TGAGCCGTGT TCTTGCCGAT 
GATGCTGAGG CAGGCGGTGG ACTCCAGGTC GCTGTGATCC AGCTCGCCAT CACCGCCGGA 
GCGTCTCTCG GCGGACTTCT CTTCGACGCT CTCGGCTGGT GGTCGACCTT CTCGCTCAGC 
GCCCTGCTTC TGTTCGGCTC TTCCCTGGCG TCCTTCGCCG CATGGCTTTC GGCCAGGAGA 
GCATCATGA

Protein sequence

MPIGTDTMTL TYNENIHSRP RAWGAVFSMT LCVFVLIASE FMPVSLLTPI AADLGVSEGS 
AGQAISISGI FAVFTSLFIA ALTRRLDRRV VVLALTFLLM LSGVAVTFAP SYPMLMLGRA 
LLGISIGGFW SMSTSIVMRL VSRDQVPKAL ALLNAGNAIA ATISAPLGSL LGSYIGWRGA 
FFLVVPVGLL ALIWQWISLP TLSPRRDGAS RNVLRLLARP PVALGMAAIL LLFMGQFAFF 
TYLRPFLEQV THLGIETLSL MLLVMGLSGV AGTSLVGRLL THRLFSILIV IPFLMACIAL 
AMIGIGEMRT PVVMSLIGWG FLGTAAPVAW GTWLSRVLAD DAEAGGGLQV AVIQLAITAG 
ASLGGLLFDA LGWWSTFSLS ALLLFGSSLA SFAAWLSARR AS