Gene Mvan_4433 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_4433
Symbol
ID	4649049
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	+
Start bp	4759058
End bp	4760710
Gene Length	1653 bp
Protein Length	550 aa
Translation table	11
GC content	66%
IMG OID	639807904
Product	extracellular solute-binding protein
Protein accession	YP_955215
Protein GI	120405386
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.766057
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCGTCTGC TCGCGGTGGG ATCGGTGGTG GCGCTGTTGG TCAGCGGGTG CTCCAGCGGC 
CAGAACGACG TCCCGTCCAC CGGCGGTAGC GCCGAGCTGG GCGCCACCGC CGACATCAAC 
CCGCAGGACC CGGCCACGCT GCAGCAGGGC GGCAACCTAC GGCTGGCGCT GACCGGCTTT 
CCGTCGAACT TCAACAACCT GCACATCGAC GGCAACCTCG GCGAGATCGG TCGCATGTAC 
CGGCCCACGC TTCCCCGCGC GTTCTTCATC AAGCCCGACG GAGAGATGAC GGTCAACAGC 
GACTACTTCA CCGACGTCGA GCTGACCAGC ACCGACCCCC AGGTAGTCAC CTACACCATC 
AACCCGAATG CGGTGTGGAC CAACGAACGA CCAGTGACCT GGGAGGACAT CGCCGCTCAG 
ATCAACGCCA CCAGCGGCAA GGACAAGCGG TTCCTGTTCG CGTCCCCGAA CGGAAGTGAG 
CGGGTCGCGT CGGTCACCAG GGGTGTCGAC GACCGGCAGG CGGTGGTCAC TTTCGCCAAG 
CACTACGCCG ACTGGCGAGG GATGTTCGCC GGGAACGGGA TGCTGTACCC GAAAGAGATC 
ACGCAGGATC CCGAGGCGTT CAACAAGGGC TTTCTCACCG GTCCCGGCCC GTCGGCGGGG 
CCTTTCATGA TCACCACGGT CGACCGCGGC GCCCAGCGAA TCACCTTGGA GCGCAACCCG 
AAGTGGTGGG GCACGCCTCC CGTGCTGGAC CGCATCACCT ACACCGTGCT CGATGACGCC 
GCGATGCTGC CCGCACTGGA GAACAACGCG CTGGACTCGA TCGGCCTGGG GACTCTGGAC 
GATCTCGAAC GTGCCCGTCG CGCCCAGGGT GTCACGATCC GCCGTGCCCC GGCCCCGAAC 
TGGTATCACC TGACCCTCAA CGGCGCCGAG GGCGCGTTGC TGTCCGATCC GGCGCTGCGG 
GCGGCGATCA CCAAGGGCAT CGACCGGCAG GCCATCACTG CGGTGTCGCA GCGCGGACTG 
ACCGATGATC CGGCCGCGCT GAACAACCAC ATCTACCTGG CGGGCCAGGA GGGCTACCAG 
GACAACAGCA TCGGCTTCGA CCCTGAGGCC GCCAAGCGCG AACTCGACGC GCTCGGCTGG 
ACACTCAACG GCCAGTTCCG GGAGAAGGAC GGGAAACCGC TGACGCTGCG CGACGTGTTC 
TACGACGGCG CCAGCACCCG CGCCATCGCC CAGGTCGCGC AGAACCAGCT CGCGCAGATC 
GGCGTCAACC TGGAGTTGGT GCCCGCCGCG GGCGGTTCGT TGTTCCCCGA CTACATCACG 
CCGGGTAACT TCGACATCGC CCAATTCGCC TGGGGTGGAG ACGCTTTCCC ACTGGGCGGG 
TTGACCCAGA TCTACGCCTC GAACGGTGAG AGCAACTACG GCAAGATCGG CAGCCCGCAG 
GTCGACGCCA AGATCGAGGA GACGCTCTCC GAGCTGGATC CCGCCAAGGC ACGCACGCTG 
GCCAACGAAC TCGACAAGAT GATCTGGGAG ATCGGGCACA GCCTGCCGCT GTTCCAGGCG 
CCCGGCAACG TGGCCGTGCG CAGCAATCTC GCCAACTACG GTCCTGCCGG CATCGGGGAC 
ATCAACTACT CGGCGATCGG CTTCATGAAG TAG

Protein sequence

MRLLAVGSVV ALLVSGCSSG QNDVPSTGGS AELGATADIN PQDPATLQQG GNLRLALTGF 
PSNFNNLHID GNLGEIGRMY RPTLPRAFFI KPDGEMTVNS DYFTDVELTS TDPQVVTYTI 
NPNAVWTNER PVTWEDIAAQ INATSGKDKR FLFASPNGSE RVASVTRGVD DRQAVVTFAK 
HYADWRGMFA GNGMLYPKEI TQDPEAFNKG FLTGPGPSAG PFMITTVDRG AQRITLERNP 
KWWGTPPVLD RITYTVLDDA AMLPALENNA LDSIGLGTLD DLERARRAQG VTIRRAPAPN 
WYHLTLNGAE GALLSDPALR AAITKGIDRQ AITAVSQRGL TDDPAALNNH IYLAGQEGYQ 
DNSIGFDPEA AKRELDALGW TLNGQFREKD GKPLTLRDVF YDGASTRAIA QVAQNQLAQI 
GVNLELVPAA GGSLFPDYIT PGNFDIAQFA WGGDAFPLGG LTQIYASNGE SNYGKIGSPQ 
VDAKIEETLS ELDPAKARTL ANELDKMIWE IGHSLPLFQA PGNVAVRSNL ANYGPAGIGD 
INYSAIGFMK