Gene Mvan_4539 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_4539
Symbol
ID	4648750
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	-
Start bp	4877009
End bp	4878835
Gene Length	1827 bp
Protein Length	608 aa
Translation table	11
GC content	72%
IMG OID	639808009
Product	extracellular solute-binding protein
Protein accession	YP_955320
Protein GI	120405491
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.874043
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGTCCGC CGCCGGCGCC GCAGAGCACC GACACCACCG AGGTGACCCC GCCGCCGCCG 
ATGAAGGCGA CGCAGATCAT CGTGGCGATC GACTCGATCG GGCCCGGATT CAACTCCCAT 
CTGTTGTCCG ACCAGTCACC GGTCAACGCG GCGATCAGCT CGCTGGTGCT GCCCAGCTCG 
TTCCGACCGA TCCCGGATTC CCGCACCCCG ACGGGTTCGC GCTGGGAGCT GGACACCTCC 
CTGCTGGAGT CGGCCGAGGT CACCGGCGAG GACCCGTTCA CCGTCACCTA CAAGATCCGG 
CCGGAGGCGC AGTGGACCGA CAACGCGCCG ATCGGCGCGG ACGACTACTG GTACCTGTGG 
CGGCAGATGG TCAGCCAGCC CGGCGCTGCC GACCCGGCCG GCTACGACCT CATCACCGGC 
GTGCAGTCCG TCGAGGGCGG CAAGACGGCC GTCGTGACGT TCGCGCAGCC CTACCCGGCG 
TGGCGTGAGA TGTTCAACGA CATCCTGCCC GCCCACATCG TCAAGGACGT CCCCGGCGGA 
TTCGGCGCAG GCCTGGCGCA GGCGCTGCCG GTCACCGGAG GGCAGTTCCG CGTCGACACC 
ATCGACCCGC AGCGTGACGA GATCCTGCTC GCGCGTAACG ACAGATATTG GGGCACGCCC 
GCCACACCGG ACCTGATCCT GTTCCGCCGC GGCGGGGCGC CCGCCGCGCT GGCCGATTCC 
ATCCGCAACG GGGACACCCA GGTCGCCCAG GTGCATGGCG GGTCGGCGGT GTTCGCCCAG 
CTGTCCGCGA TCCCCGACGT GCGCACCGCC CGGATCGTCA CCCCGCGCGT CATGCATCTG 
ACGCTGCGGG CCCAGCAGCC GATGCTGGCC GACGCGCTGG TCCGCAAGGC GGTCCTCGGC 
CTGCTCGACG TCGACCTGCT GGCCGCCGTC GGCGCCGGCG ACGACAACAC CGTCACCCTG 
GCCCAGGCCC AGGTGCGCTC GCCGTCGGAC CCCGGTTACG TCCCGACCGC CCCGCCCGCG 
ATGACGCGGG AGGATGCCAT GACCCTGCTG GCCGAGGCCG GGTATCAGGT GGACCCCGTG 
CAGGTGCCGA CCTCACCGCC GCCGGCGCCC GGTGCGCCGG AGAGCAACCG CGGCCGGCTC 
ACCAAGGACG GCGAGCCGCT GACGCTGGTG CTCGGCGTCG CCGCCAATGA CCCGACGGCG 
GTCGCGGTCG CCAACACCGC CGCCGATCAG CTGCGCAGCG TCGGGATCGC GGCGACGGTG 
GCGGCACTCG ACCCGGTGGT GCTGTACGGA GACGCCATGG TCAACAACCA GATCGATGCG 
GTAATCGGCT GGCACCCGGC AGGCGGTGAC CTCGCGACGT CGCTGGCGTC GCGCTACGGC 
TGCCCGGCGC TGGAGGCCAC CGCAGTCGAA ACCACCACCG GGGCACCGGC GCCGACCTCC 
GACCCGCCCA GACCGAGCGG AACGTCCGGA CCGCGCGGCC CGTCCGATCC GCCGACGACG 
TCGACAACGC CGACGACAGC GACGCAGACT TCGCCCGCCC CCGAGCCGGA CTCCGACCAG 
CTCGTCCAGG CGCCGAGCAA CATCACCGGA ATCTGCGACC CGCACATTCA GCCCAGGATC 
GACGCCGCAC TGCACGGCAC CGCCGACATC GCCGAGGTCA TCGACGAGGT CGAGCCCAGG 
CTGTGGGAGA TGTCCACGGT GCTGCCGATC CTGCAGGACA CCACGATCGT CGCGGCCGGC 
CCCAGCGTGC AGCACGTCAG CCTGACCGGC GCTGTGCCGG TCGGCATCGT CGGCGACGCA 
GGCAGCTGGG TCAAGCTGCC GCAGTGA

Protein sequence

MSPPPAPQST DTTEVTPPPP MKATQIIVAI DSIGPGFNSH LLSDQSPVNA AISSLVLPSS 
FRPIPDSRTP TGSRWELDTS LLESAEVTGE DPFTVTYKIR PEAQWTDNAP IGADDYWYLW 
RQMVSQPGAA DPAGYDLITG VQSVEGGKTA VVTFAQPYPA WREMFNDILP AHIVKDVPGG 
FGAGLAQALP VTGGQFRVDT IDPQRDEILL ARNDRYWGTP ATPDLILFRR GGAPAALADS 
IRNGDTQVAQ VHGGSAVFAQ LSAIPDVRTA RIVTPRVMHL TLRAQQPMLA DALVRKAVLG 
LLDVDLLAAV GAGDDNTVTL AQAQVRSPSD PGYVPTAPPA MTREDAMTLL AEAGYQVDPV 
QVPTSPPPAP GAPESNRGRL TKDGEPLTLV LGVAANDPTA VAVANTAADQ LRSVGIAATV 
AALDPVVLYG DAMVNNQIDA VIGWHPAGGD LATSLASRYG CPALEATAVE TTTGAPAPTS 
DPPRPSGTSG PRGPSDPPTT STTPTTATQT SPAPEPDSDQ LVQAPSNITG ICDPHIQPRI 
DAALHGTADI AEVIDEVEPR LWEMSTVLPI LQDTTIVAAG PSVQHVSLTG AVPVGIVGDA 
GSWVKLPQ