Gene Mvan_4564 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_4564
Symbol
ID	4649028
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	+
Start bp	4903575
End bp	4905206
Gene Length	1632 bp
Protein Length	543 aa
Translation table	11
GC content	67%
IMG OID	639808034
Product	SSS family solute/sodium (Na+) symporter
Protein accession	YP_955345
Protein GI	120405516
COG category	[R] General function prediction only
COG ID	[COG4147] Predicted symporter
TIGRFAM ID	[TIGR00813] transporter, SSS family

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.252386
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.41587
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCACCC TGCTGGCCCA GACCGAGACC ATCGGCAACC CGGTCGCCAA CATCGGCATC 
TTCAGCCTGT TCGTCGTCGT CACGATGATC GTGGTGATCC GGGCGAGCAA GCGCAACGCC 
ACCGCCGACG AGTTCTTCAC CGGCGGGCGC GGCTTCTCCG GCCCGCAGAA CGGCATCGCC 
ATCGCCGGTG ACTATCTGTC GGCCGCCAGC TTCCTCGGCA TCGCCGGCGC CATCGCGGTC 
TACGGCTACG ACGGCTTCCT GTACTCGATC GGCTTCCTGG TGGCGTGGCT GGTGGCTCTG 
CTCCTGGTGG CCGAATTGCT ACGTAACACA GGCAGATTCA CGATGGCCGA CGTGCTGAGC 
TTCCGCCTCA AGCAGCGGCC GGTGCGGTTG GCCGCGGCCA CCAACACGTT GACGGTGTCG 
CTGTTCTACC TGCTGGCCCA GATGGCCGGC GCCGGTGGCC TGGTGGCGCT GCTTCTGGAC 
ATCAACAGCC GCACCGGACA GTCCGTCGTG ATCGCCGTGG TCGGCGTGCT GATGATCGTC 
TACGTCCTGG TCGGCGGCAT GAAGGGCACC ACCTGGGTGC AGATCATCAA GGCCGTCCTG 
CTGATCGCCG GCGCGGGCTT CATGACGGTC ATGGTGCTCG CGAAGTTCGG GATGAACTTC 
TCCGAGATCC TCGGCTCGGC GCAATCCGCC ATCAGCGGTT CGACCACCAC CGGCGTCGCC 
GGCCGCGACG TGCTGGCCCC CGGTGCGCAG TACGGCGGGT CGCTGACCTC GCAGATCAAC 
TTCATCTCGC TGGCGATCGC GCTGGTGCTC GGCACCGCGG GCCTGCCGCA CGTGCTGATG 
CGCTTCTATA CGGTGCCGAC CGCCAAGGAG GCACGACGAA GCGTCGTCTG GGCGATCGCG 
CTGATCGGCG CGTTCTACCT GTTCACCCTG GTGCTGGGCT ACGGCGCGGC AGCTCTGGTG 
GGTCCCGACC GCATCCTGGG CGCGGCGGGC GGGGTGAACT CGGCGGCTCC GCTGCTGGCG 
TTCGAGCTCG GTGGGGTGGT GCTGCTTGGG GTCATCTCCG CGGTGGCGTT CGCGACGATC 
CTGGCTGTCG TGGCGGGGCT GACGATCACC GCCTCGGCGT CGTTCGCCCA CGACATCTAC 
GCCAGCGTGA TGAAGTCGCA CAAGGTGACC GAGGCCGAAC AGGTCCGGGT CTCCCGGATC 
ACCGCGGTCG TGCTCGGTGT GCTCGCCATC GGCCTCGGCA TCCTGGCCAA CGGGCAGAAC 
ATCGCGTTCC TGGTGGCGCT GGCGTTCGCG GTCGCCGCGG CGGCCAACCT TCCGACGATC 
ATCTACTCGC TGTACTGGAG GCGTTTCAAC ACCCGCGGCG CGCTGTGGAG CATGTACGGC 
GGGCTGATCT CGACCATCGT GCTGATCGTC TTCTCCCCCG CGGTGTCGGG ATCGAAGACC 
GCGATGATCC CGGGTGCGGA CTTCGCCTGG TTCCCGCTGG CCAACCCGGG CATCGTGTCG 
ATCCCGCTGG CGTTCATCCT CGGCATCGTC GGCACCCTGA CCTCACCGGA CGACGAGGAT 
CCGAAGGTCG CCGCCGAGAT GGAGGTCCGC TCGCTGACCG GCATCGGCGC CGAGAAGGCG 
GTCGCCCACT AG

Protein sequence

MTTLLAQTET IGNPVANIGI FSLFVVVTMI VVIRASKRNA TADEFFTGGR GFSGPQNGIA 
IAGDYLSAAS FLGIAGAIAV YGYDGFLYSI GFLVAWLVAL LLVAELLRNT GRFTMADVLS 
FRLKQRPVRL AAATNTLTVS LFYLLAQMAG AGGLVALLLD INSRTGQSVV IAVVGVLMIV 
YVLVGGMKGT TWVQIIKAVL LIAGAGFMTV MVLAKFGMNF SEILGSAQSA ISGSTTTGVA 
GRDVLAPGAQ YGGSLTSQIN FISLAIALVL GTAGLPHVLM RFYTVPTAKE ARRSVVWAIA 
LIGAFYLFTL VLGYGAAALV GPDRILGAAG GVNSAAPLLA FELGGVVLLG VISAVAFATI 
LAVVAGLTIT ASASFAHDIY ASVMKSHKVT EAEQVRVSRI TAVVLGVLAI GLGILANGQN 
IAFLVALAFA VAAAANLPTI IYSLYWRRFN TRGALWSMYG GLISTIVLIV FSPAVSGSKT 
AMIPGADFAW FPLANPGIVS IPLAFILGIV GTLTSPDDED PKVAAEMEVR SLTGIGAEKA 
VAH