Gene Mvan_3815 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_3815
Symbol
ID	4645955
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	-
Start bp	4065594
End bp	4066868
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	71%
IMG OID	639807281
Product	deoxyguanosinetriphosphate triphosphohydrolase-like protein
Protein accession	YP_954602
Protein GI	120404773
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0232] dGTP triphosphohydrolase
TIGRFAM ID	[TIGR01353] deoxyguanosinetriphosphate triphosphohydrolase, putative

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.548938
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.293858
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCCCAC GACTGCAGGA CAGCTACGAC GAGTTCGACC GCCAGCGCCT GGTGGCCGAA 
CCGGCGAAGA GCGCCGGCCT GCCCGGGACC GACACCGAGC ACCGCTCGGA CTTCGCACGC 
GACCGGGCCC GCGTCCTGCA CTGTGCCGCG CTGCGCCGGC TCGCCGACAA AACCCAGGTG 
GTGGGCCCCC GGGACGGTGA GACGCCGCGC ACCCGATTGA CGCATTCGCT GGAGGTCGCC 
CAGATAGGCC GTGGGATGGC GATCGGCCTG GGGTGCGACC CGGACCTCGT CGATCTGGCG 
GGCCTGGCCC ACGACATCGG TCACCCGCCC TACGGTCACA ACGGGGAACG CGCCCTCGAC 
GAGATCATCA AGGGCTTCGG CGGTTTCGAG GGCAACGCCC AGAACTTCCG CATCCTGACC 
CGCCTTGAGC CCAAGGTGCT CGACGAGCAC GGGCGCAGCG CCGGCCTGAA CCTGACCAGG 
GCGTCGCTCG ACGCGGTGGC GAAGTATCCG TGGCCGCGTC AGGAGGGCCG GCGGAAGTTC 
GGGTTCTACG GCGACGACAT GGCTGCGGCG CAGTGGGTGC GTCACGGCGC ACCCGCCGCC 
CGGCCGTGCC TGGAGGCACA GGTGATGGAC TGGGCCGACG ACGTGGCGTA CTCGGTGCAC 
GATGTCGAGG ACGGCGTCAT CTCCGGCCGT ATCGACCTGC GTGTGCTGGC CGACGCCGAT 
GCGGCGGCCT CCCTCGCCCA CGTGGGCGCC CAGTCGTTCC CGACGCTGAC CCCCGACGAT 
CTGGTTGCGG CCGCCGAGCG GCTCTCCCAG GTTCCTGTGG TGGCGGCGGT GGGCAAGTTC 
GACGGCACCC TGTCCGCATC GGTGGCCCTG AAAACGTTGA CCAGCGAGCT GGTCGGGCGG 
TTCGCCAACG CCGCCCTCAC CGCGACCCGC GACGTCGCCG GACCGGGGCC GTTGCGTCGA 
TTCGACGCCG AGTTGACGGT GCCGAGCCTG GTGCGTGCCG AGGTGGTGCT GCTCAAGACC 
CTTGCGCTGC AGTTCATCAT GTCCGATCAC CGGCACCTGC AGATCCAGGC CGACCAGCGC 
AACCGGATCC ACGAGGTGGC GCTGGCGCTG TGGGGCCAGG CGCCGGGGAG CTTGGACCCC 
CAGTTCGCGG CGGAGTTCGC CGCGGCCCCC GACGACGGCG CGCGCCTGCG GGTGGTGATC 
GACCAGATCG CCTCTTACAC CGAGAGCCGA CTGGAGCGAG TGCACGAGGC GCGCTCGCCC 
CGGCCTCTAG ACTGA

Protein sequence

MSPRLQDSYD EFDRQRLVAE PAKSAGLPGT DTEHRSDFAR DRARVLHCAA LRRLADKTQV 
VGPRDGETPR TRLTHSLEVA QIGRGMAIGL GCDPDLVDLA GLAHDIGHPP YGHNGERALD 
EIIKGFGGFE GNAQNFRILT RLEPKVLDEH GRSAGLNLTR ASLDAVAKYP WPRQEGRRKF 
GFYGDDMAAA QWVRHGAPAA RPCLEAQVMD WADDVAYSVH DVEDGVISGR IDLRVLADAD 
AAASLAHVGA QSFPTLTPDD LVAAAERLSQ VPVVAAVGKF DGTLSASVAL KTLTSELVGR 
FANAALTATR DVAGPGPLRR FDAELTVPSL VRAEVVLLKT LALQFIMSDH RHLQIQADQR 
NRIHEVALAL WGQAPGSLDP QFAAEFAAAP DDGARLRVVI DQIASYTESR LERVHEARSP 
RPLD