Gene Mvan_3024 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_3024
Symbol
ID	4647206
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	+
Start bp	3189601
End bp	3190665
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	69%
IMG OID	639806502
Product	putative agmatinase
Protein accession	YP_953833
Protein GI	120404004
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0010] Arginase/agmatinase/formimionoglutamate hydrolase, arginase family
TIGRFAM ID	[TIGR01227] formimidoylglutamase [TIGR01230] agmatinase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.197883
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.651701
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCCACG ATCACCGACC TCACCGTGAG CTCGCACCGG GTATGGCCGA GCAGCTGGAC 
CTTCCCTACG CCGGGGTGGT GTCCTTCGGC CACCGGCCCT TTCTCACCGA GTCCGAACAG 
CTCGACTCGT GGAAGCCGGA CGTTGCCGTC GTCGGCGCGC CGTTCGACGT CGGGACCACC 
AACCGTCCCG GCGCCCGTTT CGGTCCGCGG GCGATCCGCG CGACGGCCTA TGAACCCGGG 
ACGTACCACA TGGATCTGGG TCTGGAGATC TTCGACTGGC TCGAGGTCGT CGACTTCGGC 
GACGCCTACT GCCCGCACGG CCAGACGGAG GTGTCACACC GCAACATCCG GGAGCGGGTG 
CACGCGGTGG CCGACCGAGG GATCGTCCCG GTCATCCTCG GCGGCGACCA TTCGATCACC 
TGGCCCGCCG CCACGGCCGT TGCCGACGTG CACGGCTACG GCAACGTCGG CATCGTGCAC 
TTCGACGCCC ACGCCGACAC CGCCGACGAG ATCGAAGGCA ACCTCGCCAG CCACGGCACG 
CCGATGCGCC GGCTGATCGA ATCGGGCGCC GTGCCCGGTT CGCATTTCGT CCAGGTCGGG 
CTGCGCGGTT ACTGGCCGCC CCAGGATACT TTCGAGTGGA TGCTCGAACA GAAGATGACC 
TGGCACACCA TGCAGGAGAT CTGGGAGCGC GGCTTCAAGG CGGTGATGGC CGACGCGGTC 
GCCGAGGCGC TGGCCAAGGC CGACAAGCTG TACGTCTCGG TCGACATCGA CGTGCTGGAC 
CCGGCCCACG CACCGGGCAC CGGGACCCCG GAGCCCGGCG GCATTACCAG CGCAGACCTG 
TTGCGCATGG TGCGGCAACT CTGTCACGAG CACGACGTCG TCGGGGTGGA CGTGGTCGAG 
GTGGCGCCCG CCTACGACCA CGCCGAGCTC ACGATCAACG CCGCGCACCG GGTGGTGTTC 
GAGGCGCTCG CCGGGATGGC GGCCAGGCGC CGCGACGCAG CCGACGGCGA GGTGGGACAG 
CCGGCCCGGT CCTACCGGGA CCGGGGCGTC ACTTCTCCAG AGTGA

Protein sequence

MGHDHRPHRE LAPGMAEQLD LPYAGVVSFG HRPFLTESEQ LDSWKPDVAV VGAPFDVGTT 
NRPGARFGPR AIRATAYEPG TYHMDLGLEI FDWLEVVDFG DAYCPHGQTE VSHRNIRERV 
HAVADRGIVP VILGGDHSIT WPAATAVADV HGYGNVGIVH FDAHADTADE IEGNLASHGT 
PMRRLIESGA VPGSHFVQVG LRGYWPPQDT FEWMLEQKMT WHTMQEIWER GFKAVMADAV 
AEALAKADKL YVSVDIDVLD PAHAPGTGTP EPGGITSADL LRMVRQLCHE HDVVGVDVVE 
VAPAYDHAEL TINAAHRVVF EALAGMAARR RDAADGEVGQ PARSYRDRGV TSPE