Gene Mmcs_4055 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_4055
Symbol
ID	4112885
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	+
Start bp	4325259
End bp	4326884
Gene Length	1626 bp
Protein Length	541 aa
Translation table	11
GC content	67%
IMG OID	638033198
Product	SSS family solute/sodium (Na+) symporter
Protein accession	YP_641216
Protein GI	108801019
COG category	[R] General function prediction only
COG ID	[COG4147] Predicted symporter
TIGRFAM ID	[TIGR00813] transporter, SSS family

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.647451
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACCGTGC TCGCCGCCGA GACCATCGGC AACCCCGTCG CCAACATGTC GATCTTCGCC 
CTGTTCGTCC TGGTGACGCT CTTCATCGTC ATCAAGGCGA GTAAGAAGAA CGCCACCGCC 
ACCGAGTTCT TCACCGCGGG CCGCGCCTTC ACCGGTCCGC AGAACGGCAT CGCGATCAGC 
GGTGACTACC TGTCGGCCGC GAGCTTCCTC GGCATCGCCG GCGCCATCGC CGTCTACGGC 
TACGACGGGT TCCTGTACTC GATCGGATTC CTGGTCGCCT GGCTGGTGGC GCTGCTGCTG 
GTCGCCGAAC TGCTGCGCAA CACGGGAAAA TTCACCATGG CCGACGTGCT GAGCTTCCGG 
CTCAAACAAC GTCCGGTGCG GTTGGCCGCG GCCACCAACA CCCTGGCGGT GTCGTTGTTC 
TACCTGCTCG CCCAGATGGC CGGCGCCGGC GTGCTGGTCG CACTGCTGCT CAACATCGAA 
AGCGACCTCG GACAGTCGAT CGTGATCGCC GTCGTGGGCG TGCTGATGAT CGTCTACGTC 
CTGGTCGGCG GGATGAAGGG CACCACCTGG GTGCAGATCA TCAAGGCGGT CCTGCTGATC 
GGCGGCGCGG GGATCATGAC GATCATGGTG CTGGCGAAGT TCAACTTCAA CTTCTCCGAG 
ATCCTCGGCA GCGCACAGGC GATGGTGAGC AGCAGCGAGG ACGCCAAGGT CGCCTCGCGC 
GACGTGCTTG CCCCCGGCGC GCAGTACGGC GCGTCGCTGA CCACGCAGAT CAACTTCATC 
TCGCTGGCGC TGGCCCTGGT GCTCGGCACC GCCGGCCTGC CGCACGTGCT GATGCGCTTC 
TACACGGTGC CCACCGCCAA GGAGGCCCGC CGGTCGGTGG TCTGGGCGAT CGCGCTCATC 
GGCGCGTTCT ACCTGTTCAC CCTGGCCCTG GGTTACGGCG CCGCGGCCCT GGTCGGACCC 
GACCGCATCC TGGCCGCCCC CGGTGGCGTG AATTCCGCTG CGCCGCAACT GGCGTTCGAA 
CTCGGCGGCG TAGTGCTGCT GGGCGTCATC TCCGCGGTGG CGTTCGCGAC GATCCTCGCG 
GTCGTCGCCG GTCTGACCAT CACCGCGTCG GCGTCCTTCG CGCACGACAT CTACGCCAGC 
GTGATGAAGA GCCATCAGGT CACCGAGAGC GAGCAGGTCA AGATCTCGCG GATCACCGCG 
GTGGTGCTGG GCACGCTGGC GATCGGGTTG GGCATCCTGG CCCGCGAGCA GAACGTCGCG 
TTCCTGGTGG CGCTCGCGTT CGCGGTGGCC GCCGCGGCGA ATCTGCCGAC CATCCTCTAC 
TCGCTGTACT GGCGGCGTTT CAACACCCGC GGTGCGCTGT GGAGCATGTA CGGCGGGTTG 
ATCTCGACGA TCGTGCTGAT CGTATTCTCG CCCGCGGTCT CGGGCACGGC GACCTCGATG 
ATCAAGGGCG CCGACTTCGC CTGGTTCCCG CTGGCCAACC CGGGCATCGT GTCGATCCCG 
CTGGCGTTCA TCCTCGGCAT CGTCGGCACC CTGACCTCAC CAGACGACGA GGATCCGACG 
ATCGCCGCCG AGATGGAGGT GCGCTCGCTG ACCGGGGTGG GTGCGGAAAA GGCCGTCTCG 
CACTGA

Protein sequence

MTVLAAETIG NPVANMSIFA LFVLVTLFIV IKASKKNATA TEFFTAGRAF TGPQNGIAIS 
GDYLSAASFL GIAGAIAVYG YDGFLYSIGF LVAWLVALLL VAELLRNTGK FTMADVLSFR 
LKQRPVRLAA ATNTLAVSLF YLLAQMAGAG VLVALLLNIE SDLGQSIVIA VVGVLMIVYV 
LVGGMKGTTW VQIIKAVLLI GGAGIMTIMV LAKFNFNFSE ILGSAQAMVS SSEDAKVASR 
DVLAPGAQYG ASLTTQINFI SLALALVLGT AGLPHVLMRF YTVPTAKEAR RSVVWAIALI 
GAFYLFTLAL GYGAAALVGP DRILAAPGGV NSAAPQLAFE LGGVVLLGVI SAVAFATILA 
VVAGLTITAS ASFAHDIYAS VMKSHQVTES EQVKISRITA VVLGTLAIGL GILAREQNVA 
FLVALAFAVA AAANLPTILY SLYWRRFNTR GALWSMYGGL ISTIVLIVFS PAVSGTATSM 
IKGADFAWFP LANPGIVSIP LAFILGIVGT LTSPDDEDPT IAAEMEVRSL TGVGAEKAVS 
H