Gene Mmcs_2734 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_2734
Symbol
ID	4111566
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	+
Start bp	2879987
End bp	2881024
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	71%
IMG OID	638031858
Product	agmatinase
Protein accession	YP_639897
Protein GI	108799700
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0010] Arginase/agmatinase/formimionoglutamate hydrolase, arginase family
TIGRFAM ID	[TIGR01227] formimidoylglutamase [TIGR01230] agmatinase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGCCATG CGCACGACCG CGAGCCGCAA CGGGATGTCC CGCCGGGAAT GGCCGAACAA 
CTCGACCTGC CCCATTCGGG GATGGCCACT TTCGGTCATC GGCCGTTCCT GACCGAGACC 
GCCCAACTGG ACTCGTGGCG GCCCGATGTC GCGATCGTCG GTGCGCCGTT CGACGTGGGG 
ACCACCAACC GCCCGGGCGC GCGGTTCGGG CCGCGCGCCA TCCGGGCGAC GGCGTACGAA 
CCCGGCACGT ACCACATGGA TCTGGGGCTG GAGATCTTCG ACTGGCTGGA GGTGGTCGAC 
TTCGGCGACG CCTACTGTCC GCACGGGCAG ACCGAGGTGT CGCACGCCAA CATCCGCGAG 
CGGGTGGCCG CGGTCGCGTC GCGCGGCATC GTGCCGGTCG TCCTCGGTGG TGACCACTCG 
ATCACGTGGC CGGCAGCCAC CGCGGTCGCC GATGTGCACG GCCACGGCAA CGTCGGCATC 
GTGCACTTCG ACGCCCACGC CGACACCGCC GACACCATCG AGGGCAACCT GGCCAGTCAC 
GGCACGCCGA TGCGGCGGCT CATCGAATCG GGTGCGGTCC CCGGAACCCA CTTCGTACAA 
GTCGGTCTGC GCGGCTACTG GCCGCCGCAG GACACCTTCG AGTGGATGCT CGAACAGGGC 
ATGACCTGGC ACACCATGCA GGAGATCTGG GAGCGCGGCT TCCAGGAGGT GATGCGCGAC 
GCGGTGGCCG AGGCGCTCGC CAGGGCCGAC AAGCTCTACG TCTCCGTGGA CATCGACGTC 
CTCGATCCCG CCCACGCCCC CGGCACCGGG ACCCCGGAAC CGGGCGGCAT CACCAGCGCG 
GACCTACTCC GGATGGTCCG GCGGCTCTGT TACGAGCACG ATGTGGCGGG TGTCGACGTC 
GTCGAGGTCG CACCGGCCTA CGACCACGCC GAACTGACCG TCAACGCCGC GCACCGGGTG 
GTGTTCGAAG CGCTGGCCGG GATGGCGGCC CGCAGGCGCG ACGCCGCGGG CGCCCAGCCC 
GGTCCGCCCG CCCGGTGA

Protein sequence

MGHAHDREPQ RDVPPGMAEQ LDLPHSGMAT FGHRPFLTET AQLDSWRPDV AIVGAPFDVG 
TTNRPGARFG PRAIRATAYE PGTYHMDLGL EIFDWLEVVD FGDAYCPHGQ TEVSHANIRE 
RVAAVASRGI VPVVLGGDHS ITWPAATAVA DVHGHGNVGI VHFDAHADTA DTIEGNLASH 
GTPMRRLIES GAVPGTHFVQ VGLRGYWPPQ DTFEWMLEQG MTWHTMQEIW ERGFQEVMRD 
AVAEALARAD KLYVSVDIDV LDPAHAPGTG TPEPGGITSA DLLRMVRRLC YEHDVAGVDV 
VEVAPAYDHA ELTVNAAHRV VFEALAGMAA RRRDAAGAQP GPPAR