Gene Mvan_2624 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_2624
Symbol
ID	4643394
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	-
Start bp	2772249
End bp	2773583
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	66%
IMG OID	639806106
Product	extracellular solute-binding protein
Protein accession	YP_953438
Protein GI	120403609
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAATCA CGCAATGGCC CACTTCGGGG CGGAGAAGCG GGCGCCCAGG CACCGCGTTC 
TCCGCCGTGA TGGCACTGGT CGCCGTCCTG GCCCTGGTGT TGACCGGGTG CGCGGGCAGC 
GGCGGGCCCG AACAGGCCGA AGCCACCGGC ACCGGCGAGG TCTCCACCGA CGTCTCGGGC 
ACCGTGCGGA TCCTGATGGA GAACGTGCCG GACACCGACA TCGTCAAGTC CATGGTGGCC 
GACTTCAACA AGGAATACCC GGGCGTCGAG ATCAACATCG AGTCGCTGAC GTTCGATCAG 
ATGCGCGACA AACTCGTGTC CTCGTTCCAG TCCTCGTCGC CCACCTACGA CCTGATCGTC 
GTCGACAACC CGTGGATGGT CGACTTCGCC AACGCGAAGT TCCTGCAGCC CCTCGATGCC 
CGCATCGACA GCACCCCGGA CTACGACGCC GCCGACTTCT TCAAGCCGCT CACCGACATC 
ACCACTGTCG ACGGAGCCCG CTACGGTGTG CCGTTCTACA ACTACGCGCT CGGATACCTT 
TACAACGCCG ACGATCTCAC GGCCGCCAAC CAGCAGGTGC CGACGACCCT CGACGAGCTG 
GTCAGCACCA GCAAGGCGCT CAAGAGCGGC GACCGCGCCG GCATCGCGAT GCAGCCGCAG 
CGTGGCTACA AGATCTTCGA AGAGTGGGGC AACTGGCTGT TCGCCGCGGG CGGATCGATC 
TACGACGCCG ACGGCAAGAT CACGCTGAAC ACGCCGGAAG CCAAGCGGGC ACTCGAGGCT 
TACATCGACA CCTACAACAC CGCCGCGCCG GCCAACAGCC TGAGCTGGGG CATGGACGAG 
GCGCAGCGTT CGGTGTCGGC GAACCAGGCC GCGTCGATGA TCAATTACAA CTGGCAGCTG 
CCCGCCCTCA ACGAACCGGG CTCCGGGCCG GCCGCAGGCA AGATCAAGCT CGCCACCATC 
CCCGGCGGCA AGCAGGTACT GGGCTCATGG AGCTGGGCGA TCCCGGCCAA TTCGGCCACA 
CCCGACGCGG CATGGGCGTT CGTCTCGTGG ATCACCGCCA AGCCCAACGA TGTCGTGCGC 
ACCGAGAAGG GCGGCGCCGC GATCCGGCAG AGCACACTGC AGGACCCGGC CGTGCTGGGC 
GGACAGTTCG GCGAGGAGTA CTACCGGACC GTCGAGCAGC TGCTTGCCAA CGCGGCTCCG 
CTGACCCAGG GGCCCAGCGG TGAGGAGATG ATCCAGGCAG TCGGCACCGA GCTCAACGAA 
GCGGTCGCCG GCAAGAAGAG CGTCGACGAC GCACTGGCCG CCGCACAGGC CGAGGCAGAG 
AAGATCCAAG GCTAG

Protein sequence

MRITQWPTSG RRSGRPGTAF SAVMALVAVL ALVLTGCAGS GGPEQAEATG TGEVSTDVSG 
TVRILMENVP DTDIVKSMVA DFNKEYPGVE INIESLTFDQ MRDKLVSSFQ SSSPTYDLIV 
VDNPWMVDFA NAKFLQPLDA RIDSTPDYDA ADFFKPLTDI TTVDGARYGV PFYNYALGYL 
YNADDLTAAN QQVPTTLDEL VSTSKALKSG DRAGIAMQPQ RGYKIFEEWG NWLFAAGGSI 
YDADGKITLN TPEAKRALEA YIDTYNTAAP ANSLSWGMDE AQRSVSANQA ASMINYNWQL 
PALNEPGSGP AAGKIKLATI PGGKQVLGSW SWAIPANSAT PDAAWAFVSW ITAKPNDVVR 
TEKGGAAIRQ STLQDPAVLG GQFGEEYYRT VEQLLANAAP LTQGPSGEEM IQAVGTELNE 
AVAGKKSVDD ALAAAQAEAE KIQG