Gene Mvan_0438 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_0438
Symbol
ID	4647813
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	-
Start bp	475685
End bp	477334
Gene Length	1650 bp
Protein Length	549 aa
Translation table	11
GC content	64%
IMG OID	639803946
Product	extracellular solute-binding protein
Protein accession	YP_951292
Protein GI	120401463
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4166] ABC-type oligopeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.397858
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACATAT TTCGCCGAGC ACTGATCATC GCCTGCGTCG CATCGCTGGC CGCTTTCGGA 
GTGGCGGCCT GCGGCAGCGA CGACAGTTCC GGCGGCGGCG GGGGCAGCGG CGGTGACATC 
ACCGTGAACG CAACGTCGTT CCCCGACTAC ATCGACCCGC AGCTGTCCTA CACCGTGGAG 
GGCTGGGAGG TGTTGTGGAA CGTCTACACC CCGCTGCTGA CCTACAGGCA CGCCAGGGGC 
AAGGAGGGCA CCGAGGTGGT CCCGGCCCTG GCCGAGGCGC TGCCGGACAT CTCCCCGGAC 
GGGAAGACCT ACAAGCTCAA ACTGCGGCCG AACATGAAGT ACTCGGACGG CACCCCGATC 
AAGGCGTCCG ACTTCACGTA CGCGATTCAG CGCCTGTTCA AGACGGATTC GGGCGGCTCG 
GTCTTCTACA ACGTCATCGC CGGCGCCACG GAGTACGCCG ACGGTGCCGC CGACACGATC 
ACCGGCATCA CCACCGATGA CGGGACCGGC GACATCACCA TCCAATTGAC CGAACCCAAC 
GGCACTTTCG ACAATCTGCT GGGGCTGATG TTCGCCGCGC CGATCCCGCA GAGCACGCCA 
CTGGACGCCG ACGCGACGAA CAACCCGCCA CCGGCGAGCG GACCGTTCAT GTTCACCACG 
GTCGACGCCC CGCGCACGCT GACGATGGAA CGCAATCCGC AGTTCCAGAC CGTCAAGGAC 
GCGGGCGCCG ACGAGGTCGC CGACGCCGGG GTGGACAAGA TCACCCTCAT CGAGAACAAG 
AACCAGAGCG CGCAGGTGAC CGACATCATG CAGAACAAGG TCGATTTCAT GATGGACCCG 
GTGCCATCGG ACCGGCTGCA GGAGGTGAAG AGCCGCTACT CCGACCGGTT CCGGATGGAG 
GACTCGATCA ACACCTACTA CATGTTCATG AACACCGAGC GGGCCCCCTT CAACGACGTC 
AGGGTGCGAC AGGCGATCAA CTACGCCATC GACCCCGAGG CGCTGAACCG GATCTTCGGC 
GGCCGGCTGC ACCCGACTCA GCAGGTTCTG CCACCGGGCA TGCCGGGCTA CCAGGAATAC 
AAGCTGTATC CGGGGCCGGA CATGGACAAG GCCAGAGCGC TGATCGCCGA GGCGAATCCG 
GCCGACCGCG ACATCACGGT GTGGACCGAC GACGAGCCGG ACCGCAAGCG CATCGGTGAG 
TACTACCACG ACCTGCTCAC CCAGCTCGGC TTCAACGCCA CGCTGAAAGT GATTGCGGGC 
GACGTGTACT GGACGACGGT GGGCAACCAG TCCACCCCGG ACGTGGACAC CGGCTTCGCC 
GACTGGTTCC AGGATTTCCC GCATCCCGAC GACTTCTTCC GTCCGCTGCT GCACGGTGAC 
AGCATCCTGC CGACCAACGG GAACAACCTG TCCCGCGCCA ACATCGCGGA GAACAACGCC 
AAGATGGACG AACTGGTCAC CAAGCAGATC ACCGACGAGG GTGTCGAACA GCAGTACGCC 
GACTTGGACC GGGCCTACAT GGAGCAGGCG GTGTGGGCCC CGTACGGCAA CGAGCAGTTC 
ACCACGTTCC TGTCGGAGCG GATGGACTTC GACAAGTCGT ATCATCATCT GCTGTTCAAG 
CAGGATTTCA CCTCGTTCGC GCTGAAGTAG

Protein sequence

MHIFRRALII ACVASLAAFG VAACGSDDSS GGGGGSGGDI TVNATSFPDY IDPQLSYTVE 
GWEVLWNVYT PLLTYRHARG KEGTEVVPAL AEALPDISPD GKTYKLKLRP NMKYSDGTPI 
KASDFTYAIQ RLFKTDSGGS VFYNVIAGAT EYADGAADTI TGITTDDGTG DITIQLTEPN 
GTFDNLLGLM FAAPIPQSTP LDADATNNPP PASGPFMFTT VDAPRTLTME RNPQFQTVKD 
AGADEVADAG VDKITLIENK NQSAQVTDIM QNKVDFMMDP VPSDRLQEVK SRYSDRFRME 
DSINTYYMFM NTERAPFNDV RVRQAINYAI DPEALNRIFG GRLHPTQQVL PPGMPGYQEY 
KLYPGPDMDK ARALIAEANP ADRDITVWTD DEPDRKRIGE YYHDLLTQLG FNATLKVIAG 
DVYWTTVGNQ STPDVDTGFA DWFQDFPHPD DFFRPLLHGD SILPTNGNNL SRANIAENNA 
KMDELVTKQI TDEGVEQQYA DLDRAYMEQA VWAPYGNEQF TTFLSERMDF DKSYHHLLFK 
QDFTSFALK