Gene Mvan_0122 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_0122
Symbol
ID	4648054
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	+
Start bp	136098
End bp	137135
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	66%
IMG OID	639803633
Product	substrate-binding region of ABC-type glycine betaine transport system
Protein accession	YP_950979
Protein GI	120401150
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG4521] ABC-type taurine transport system, periplasmic component
TIGRFAM ID	[TIGR01728] ABC transporter, substrate-binding protein, aliphatic sulfonates family [TIGR01729] taurine ABC transporter, periplasmic binding protein

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.592711
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACTCA AAGCCCTTCT CGTGGTTCTC GTCTCGGCCG TGCTGGCCCT GGCGGGCTGC 
TCGGTGGACA ACGGAGGGCA GCACGGCGAC GACTCAGGCA AGCCGACCAT CCGGATCGGC 
TACCAGACGT TCCCGAGCGG CGACCTGATC GTCAAGAACA ACAAGTGGCT CGAAGAAGCG 
TTGCCCGACT ACAACATCAA GTGGACGAAG TTCGACTCGG GCGCCGACGT GAACACGGCC 
TTCGTGGCAG GAGAACTCGA CTTCGGTGCG CTGGGCTCCA GCCCCGTCGC GCGCGGCCTG 
TCCGAGCCGC TGAACATCCC GTACAAGGTC GCGTTCGTGC TCGACGTCGC CGGCGACAAC 
GAGGCCCTGG TGGTGCGTAA CGGGGCAGGC GTCGACACCA TCGCGCAACT GAAGGGCAGG 
CGTATCGGCA CCCCGTTCGC GTCCACCGCG CACTACAGCC TGCTGGCCGC GCTCGACCAG 
AATGGCTTGT CGGCCAACGA TGTTCAGCTA ATCGACCTGC AACCGCAGGC CATCCTCGCG 
GCCTGGGAGC GCGGGGACAT CGACGCCGCC TACACCTGGC TGCCGACCCT GGACGAGCTG 
CGCAAGACCG GCCGGGATCT GATCACCAGT CGTCAGCTCG CCGATGCCGG CAAGCCCACG 
CTCGATCTGG CGACCGTCAG CGACGAGTTC GCGTCCGCCC ACCCCGAGGC CGTCGATGTG 
TGGCGGCAGC AGCAGGGACG CGCGCTTGAC CTCATCCGGG AGGATCCGCA GGCTGCCGCC 
GAAGCCATCG CCGCCGAGAT CGGCCTGACC CCGCAGGATG TGGCCGGTCA ACTCAAGCAG 
ATGGTGTTCC TCACCCCGCA GGACATCTCA TCCACGGAAT GGCTTGGCAC TGAGGGTAAT 
CCAGGCAACC TCGCGGTGAA CCTGGAATCC GCTTCGCAGT TCCTGGCCGA TCAGTCGCAG 
ATCCCGGCCG CGGCGCCGTT GAAGACGTTC CAGGACGCCG TCTACACGAA AGGCCTACCG 
GGTGCCCTCA ACGAATGA

Protein sequence

MKLKALLVVL VSAVLALAGC SVDNGGQHGD DSGKPTIRIG YQTFPSGDLI VKNNKWLEEA 
LPDYNIKWTK FDSGADVNTA FVAGELDFGA LGSSPVARGL SEPLNIPYKV AFVLDVAGDN 
EALVVRNGAG VDTIAQLKGR RIGTPFASTA HYSLLAALDQ NGLSANDVQL IDLQPQAILA 
AWERGDIDAA YTWLPTLDEL RKTGRDLITS RQLADAGKPT LDLATVSDEF ASAHPEAVDV 
WRQQQGRALD LIREDPQAAA EAIAAEIGLT PQDVAGQLKQ MVFLTPQDIS STEWLGTEGN 
PGNLAVNLES ASQFLADQSQ IPAAAPLKTF QDAVYTKGLP GALNE