Gene Mvan_3877 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_3877
Symbol
ID	4649194
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	+
Start bp	4147128
End bp	4149134
Gene Length	2007 bp
Protein Length	668 aa
Translation table	11
GC content	69%
IMG OID	639807343
Product	glycoside hydrolase 15-related
Protein accession	YP_954664
Protein GI	120404835
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3387] Glucoamylase and related glycosyl hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.929233
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.274692
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTCTGC CGCAGACCGA GACCTCCGAC GGCGTGTCCC CCAACGGTGA CGGAGGGGCG 
TTCGCGCTGT CCAGCCCGGC GGCGTATCCC AGCTCCGGGC CGCTGCGCAA CCCGTTCCCG 
CCGATCGCCG ACTACGCGTT CCTGTCCGAC TGCGAAACGC AGTGCCTGAT CTCGTCGGCC 
GGCTCGGTGG AGTGGCTGTG CGTGCCGCGG CCCGACTCGC CCAGCGTGTT CGGCGCGATC 
CTGGACCGCG GCGCCGGCCA CTTCCGGCTC GGTCCGTACG GGGTGTCGGT GCCCGCGGCG 
CGGCGCTATC TGCCCGGCAG CCTGATCCTG GAGACCACCT GGCAGACCCC CACCGGCTGG 
GTGATCGTGC GCGACGCCCT CGTGATGGGA CCGTGGCACG ATCTCGACAC CCGCTCCCGG 
ACCCACCGCC GCACGCCGAT GGACTGGGAT GCCGAGCACA TCCTGCTGCG CACCGTCCGG 
TGCGTCAGCG GCACGGTGGA ACTGGTGATG AGCTGCGAGC CGTCGTTCGA CTACCACCGC 
ACCAGCGCGC ACTGGGAGTA TTCGGCGCAG GCCTACGGCG AGGCCATCGC GCGGGCCACC 
AAGAACCCGG ACTCCCATCC GACGCTGCGG CTGACCACCA ATCTGCGGAT CGGTCTGGAG 
GGTCGGGAGG CCCGGGCCCG GACCCGTTTG AAGGAAGGGG ACAACGTCTT CGTCGCGCTG 
AGCTGGTCCA AGCACCCGGC GCCCCAGAAC TACCAGGAGG CCGCCGACAA GATGTGGACG 
ACCAGCGAAT GCTGGCGCCA GTGGATCAAC GTCGGTGACT TCCCCGACCA CCCGTGGCGG 
GCCTACCTGC AACGCAGTGC GCTGACGCTG AAGGGTCTGA CCTACTCCCC GACCGGCGCG 
CTGCTCGCCG CGCCGACCAC GTCGCTGCCG GAGAGTCCTC AAGGCGAACG CAACTGGGAC 
TACCGCTACG CCTGGGTGCG CGACTCCACG TTCGCACTCT GGGGCTTGTA CACGCTGGGC 
CTGGACCGCG AGGCCGACGA CTTCTTCGCG TTCATCGCCG ACGTGTCGGG CGCCAACAAC 
GGAGACCGGC ACCCGCTGCA GGTGATGTAC GGCGTCGGCG GGGAACGCAG CCTGGTCGAG 
GAGGAGCTCA ACCACCTGTC GGGCTACGAC AACGCCCGAC CGGTCCGCAT CGGCAACGGC 
GCCTACAACC AGATGCAGCA CGACATCTGG GGCACCCTGC TCGATTCGGT CTACCTGCAC 
ACCAAGTCGC GCGAGCAGAT CCCCGAGACA CTGTGGCCGG TGCTCAAGGA ACAGGTCGAG 
GAGGCGGTCA AGCACTGGCG CGAGCCCGAC CGCGGCATCT GGGAGGTGCG CGGAGAACCG 
CAGCACTTCA CCTCCAGCAA GATCATGTGC TGGGTGGCGC TCGACCGGGG CGCCAAGCTC 
GCCGAGTTCG AGGGCGAGAA GTCCTACGCC CAGCAGTGGC GCGCGATCGC CGAGGAGATC 
AAGGCCGACA TCCTCGAACA CGGCGTCGAC GAGCGCGGTG TGCTGACCCA GCGCTACGGG 
CACGACGCGC TGGACGCGTC ACTGCTGTTG GCGGTGCTGA CCCGGTTCCT GCCACCCGAC 
GATCCGCGGA TCCGGGCGAC GGTGCTGGCC ATCGCCGACG AGCTGACCGA AGAGGGCCTG 
GTGCTGCGCT ACCGGGTCGA GGAGACCGAC GACGGGCTGT CCGGCGAAGA GGGCACGTTC 
ACGATCTGCT CGTTCTGGCT GGTGTCGGCG CTGGTCGAGA TCGGCGAGAT CCATCGGGCC 
CGGCATCTGT GTGAGCGGCT GCTGTCGTTC GCCAGCCCGC TGCACCTCTA CGCCGAGGAG 
ATCGAACCGC GCACCGGGCG GCACCTGGGC AACTTCCCGC AGGCGTTCAC CCACCTGGCG 
CTGATCAACG CCGTGGTGCA CGTGATCCGC GCCGAGGAAG AGGCCGACAG CTCCGGGGTG 
TTCCAGCCGG CGAACGCCCC CGTATAA

Protein sequence

MVLPQTETSD GVSPNGDGGA FALSSPAAYP SSGPLRNPFP PIADYAFLSD CETQCLISSA 
GSVEWLCVPR PDSPSVFGAI LDRGAGHFRL GPYGVSVPAA RRYLPGSLIL ETTWQTPTGW 
VIVRDALVMG PWHDLDTRSR THRRTPMDWD AEHILLRTVR CVSGTVELVM SCEPSFDYHR 
TSAHWEYSAQ AYGEAIARAT KNPDSHPTLR LTTNLRIGLE GREARARTRL KEGDNVFVAL 
SWSKHPAPQN YQEAADKMWT TSECWRQWIN VGDFPDHPWR AYLQRSALTL KGLTYSPTGA 
LLAAPTTSLP ESPQGERNWD YRYAWVRDST FALWGLYTLG LDREADDFFA FIADVSGANN 
GDRHPLQVMY GVGGERSLVE EELNHLSGYD NARPVRIGNG AYNQMQHDIW GTLLDSVYLH 
TKSREQIPET LWPVLKEQVE EAVKHWREPD RGIWEVRGEP QHFTSSKIMC WVALDRGAKL 
AEFEGEKSYA QQWRAIAEEI KADILEHGVD ERGVLTQRYG HDALDASLLL AVLTRFLPPD 
DPRIRATVLA IADELTEEGL VLRYRVEETD DGLSGEEGTF TICSFWLVSA LVEIGEIHRA 
RHLCERLLSF ASPLHLYAEE IEPRTGRHLG NFPQAFTHLA LINAVVHVIR AEEEADSSGV 
FQPANAPV