Gene Mvan_4810 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_4810
Symbol
ID	4646900
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	-
Start bp	5151276
End bp	5152484
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	68%
IMG OID	639808280
Product	arginine deiminase
Protein accession	YP_955589
Protein GI	120405760
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2235] Arginine deiminase
TIGRFAM ID	[TIGR01078] arginine deiminase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGGATG CGACGCTGGG ATGCAATTCG GAGGTCGGCA GGCTTCGGGT CGTCATCCTG 
CATCGCCCGG GGCCTGAGTT GCAGCGGTTG ACTCCCCGCA ACAACGACAC CCTGCTCTTC 
GACGGGCTGC CCTGGGTGGC AAGGGCTCAG CAGGAGCATG ACGCGTTCGC CGAGCTGCTG 
CGGTCGCGGG GGGTCGAGGT GCTGCTGCTC GGTGTGCTGT TGACCGAGGC GCTGTCCAAC 
AGCGGCGCGG CCCGCATGCA CGGCATCTCC GCTGCCGTCG ATTCCCGCCG TCTCGGTGTG 
CCGCTGGCCC AGGAACTTTC GGCGTACCTG CGCACACTGG ACGCGGCTGC GCTGGCCCGC 
ATCCTGATGG CGGGCATGAC GTTCGACGAG TTGCCGTTCG GGGAGAACGA GTTGTCGTTG 
GTGCGGCGCA TGCACCACGG TGCGGACTTC GTCATCGACC CACTGCCCAA CCTGCTGTTC 
ACCCGCGACT CGTCGTTCTG GATCGGTCCG CGGGTGGCGA TCACCTCGCT GTCGATGCAC 
GCGCGGGTGC GGGAGACGTC GCTGACCGAT CTGATCTATG CCCACCATCC CCGCTTTCTC 
GGGGTGCGGC GGGCCTACGA GTCGCGGTCG GCACCGATCG AGGGCGGCGA CGTGCTGCTG 
CTCGCGCCCG GTGTGGTGGC GGTCGGCGTG GGGGAGCGCA CCACACCTGC CGGGGCGGAA 
GCGTTGGCAC GCAGCCTGTT CGACGACGAC CTCGCGCATA CGGTGCTGGC GGTGCCGATC 
GCCCAGGAGC GCGCCCAGAT GCATCTGGAC ACGGTGTGCA CGATGGTCGA CACCGATGCG 
GTGGTGATGT ACCCGAACAT CCAGGACTCG TTGACCGCCT TCACGATTCG CCGTGAGTCG 
GGCGGGGTGA AGATCGACCG TGCCGCACCG TTCGTCGACG CGGCCGCCGA CGCGATGGGA 
ATCGCCAAGC TGCGGGTGAT CGACACCGGG CTGGATCCCG TCACCGCCGA GCGCGAGCAG 
TGGGACGACG GCAACAACAC TTTGGCGGTA GCGCCCGGCG TGGTGGTCGC CTACGAGCGC 
AACACCGAAA CCAATGCGCG CCTGGCAGAT TCGGGTATCG AGGTGCTGCC GATCTCGGCC 
TCGGAACTCG GTACCGGCCG CGGCGGGCCG CGCTGTATGT CCTGCCCGGC CGGCCGCGAC 
CCGCTCTAG

Protein sequence

MTDATLGCNS EVGRLRVVIL HRPGPELQRL TPRNNDTLLF DGLPWVARAQ QEHDAFAELL 
RSRGVEVLLL GVLLTEALSN SGAARMHGIS AAVDSRRLGV PLAQELSAYL RTLDAAALAR 
ILMAGMTFDE LPFGENELSL VRRMHHGADF VIDPLPNLLF TRDSSFWIGP RVAITSLSMH 
ARVRETSLTD LIYAHHPRFL GVRRAYESRS APIEGGDVLL LAPGVVAVGV GERTTPAGAE 
ALARSLFDDD LAHTVLAVPI AQERAQMHLD TVCTMVDTDA VVMYPNIQDS LTAFTIRRES 
GGVKIDRAAP FVDAAADAMG IAKLRVIDTG LDPVTAEREQ WDDGNNTLAV APGVVVAYER 
NTETNARLAD SGIEVLPISA SELGTGRGGP RCMSCPAGRD PL