Gene Mext_3924 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_3924
Symbol
ID	5834821
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	-
Start bp	4362546
End bp	4363655
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	73%
IMG OID	641369715
Product	agmatinase
Protein accession	YP_001641366
Protein GI	163853323
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0010] Arginase/agmatinase/formimionoglutamate hydrolase, arginase family
TIGRFAM ID	[TIGR01230] agmatinase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.0571349
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGAGTG CGGGTGAGAT CGCACCATCG CTGCACGTGG CTGTGGAGAC GCCGCGCCGG 
GGGAGGATCG TCATGGCGGA TGAGAGCGAA TCGGCGGGCG CGCGGGCGGA ACGGCTGGCG 
CGGTTCCAGC CGGCCTCGGG GATGGTGACG CCACGCTTCT CGGGGCTGGC GAGCTTCATG 
CGGCTGCCGG TGCTCGATCC CGCCGAGGCG GTGGGAGACA GGGCCGGCGA AGGGGCTGGC 
GAAGGGACTG GACTGGTCGA GATCGGTCTG ATCGGCATCC CCTTCGACGG CACCACCACC 
AACCGCCCCG GTGCCCGGCT CGGACCGCGG GCCGTGCGCG AAGCCTCCAC CGGCACGCGG 
GCGCTCAACC ACGCCACGGG GGTGGCGCCC TACGCCCTGG CCGCCTGCGC CGATCTCGGC 
GACGTGCCGG TCAACCCGGT GGACGCCGCC GAGACCGCCC GGCGGATCGA GGCGTTCTAC 
CGGCCGCTCG CCGAGGCCGG GATCGTGCCG CTCACGGTCG GCGGCGACCA TTTCATCACC 
TATCCGGTGC TGCGGGCGCT CGGGGCCGCC CGGCCGCTCG GGCTGATCCA TATCGACGCC 
CACAGCGACA CCGACGACAC TCAGTATGGC GGGGCGCGGC TCACCCACGG CACGCCGTTC 
CGGCGCGCGA TCGAGGACGG GGTGCTCGAT CCGCGGCGCT GCATCCAGAT CGGCATCCGC 
GGCAGCATGG ATGCGGCCGA CGAGCGCGAC TGGGCCCTGG CGCAGGGCAT GCGCATCCTC 
ACGATGGAGG AGGTCTGCGC CCGCGGCCTG CCGGAGGTGG CCGCGGAAGC CCGCGCCGTG 
ACCGGCGACG GCCCGACCTA TCTCAGCTTC GACATCGACG CCCTCGATCC CGCCTTCGCC 
CCCGGCACCG GCACGCCGGA GATCGGCGGC TTCACCACTC GCGAGGCGCT GCACCTGCTG 
CGGGCCCTGC GCGGCCTCGA TCTCGTCGGG GCGGATGTGG TGGAGGTCGC TCCTCCGCTC 
GATTCCGCCG GCATCACGGG TTTGGCGGGC GCCGGCATCG CCTTCGAGAT CCTGTGCCTG 
CTGGCCGAGC GGGTCGCCGC ACGGCGCTGA

Protein sequence

MRSAGEIAPS LHVAVETPRR GRIVMADESE SAGARAERLA RFQPASGMVT PRFSGLASFM 
RLPVLDPAEA VGDRAGEGAG EGTGLVEIGL IGIPFDGTTT NRPGARLGPR AVREASTGTR 
ALNHATGVAP YALAACADLG DVPVNPVDAA ETARRIEAFY RPLAEAGIVP LTVGGDHFIT 
YPVLRALGAA RPLGLIHIDA HSDTDDTQYG GARLTHGTPF RRAIEDGVLD PRRCIQIGIR 
GSMDAADERD WALAQGMRIL TMEEVCARGL PEVAAEARAV TGDGPTYLSF DIDALDPAFA 
PGTGTPEIGG FTTREALHLL RALRGLDLVG ADVVEVAPPL DSAGITGLAG AGIAFEILCL 
LAERVAARR