Gene Mflv_3303 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mflv_3303
Symbol
ID	4974624
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium gilvum PYR-GCK
Kingdom	Bacteria
Replicon accession	NC_009338
Strand	+
Start bp	3488963
End bp	3489985
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	70%
IMG OID	640457526
Product	putative agmatinase
Protein accession	YP_001134568
Protein GI	145223890
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0010] Arginase/agmatinase/formimionoglutamate hydrolase, arginase family
TIGRFAM ID	[TIGR01227] formimidoylglutamase [TIGR01230] agmatinase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.345323
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.151363
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGAAC AACTGGAGCT GGCGTACGCC GGGATGGCGT CCTTCGGGCA TCGCCCGTTC 
CTGACCGAGG TCGAGCAGCT CGACTCCTGG AGGCCCGACG CGGCGATCGT CGGCGCACCG 
TTCGACGTGG GGACCACCAA CAGACCCGGC GCGCGCTTCG GGCCCAGGGC CATCCGCGCC 
ACCGCCTATG AGCCCGGCAC CTATCACATG GACCTCGGGC TGGAGATCTT CGACTGGCTC 
GAGGTCGTCG ACTTCGGTGA CGCCTACTGC CCACACGGCC AGACCGAGGT GTCGCACAAC 
AACATTCGCG AACGCGTGCA CATGCTCGCC TCCCGCGGCA TCGTGCCCGT GGTGCTCGGC 
GGCGACCACT CCATCACCTG GCCCGCGGCG ACCGCGGTCG CCGACGTCCA CGGCTACGGC 
AACGTCGGCA TCGTGCACTT CGACGCCCAC GCCGACACCG CCGACGAGAT CGAGGGCAAC 
CTCGCCAGCC ACGGCACTCC GATGCGCCGG CTGATCGAGT CCGGTGCGGT GCCCGGGTCA 
CATTTCGTTC AGGTCGGCCT ACGCGGCTAC TGGCCGCCCC GCGACACGTT CGACTGGATG 
CTCGAGCAGA AGATGACCTG GCACACGATG CAGGAGATCT GGGAGCGAGG GTTCAAGGCG 
GTGATGGCCG ACGCGGTCGG CGAGGCCCTG GCCAAGGCCG ACAAACTCTA CGTCTCCGTG 
GACATCGACG TGCTCGATCC CGCGCACGCA CCGGGCACGG GAACGCCGGA GCCGGGCGGC 
ATCACCAGCG CCGACCTGCT GCGCATGGTG CGGCAACTCT GCTACGAACA CGACGTCGCC 
GGCGTGGACG TCGTCGAGGT GGCACCGGCC TACGACCACG CCGAGCTCAC GGTCAACGCC 
GCGCACCGGG TGGTGTTCGA GGCACTCGCC GGCATGGCGG CGCGATGCCG GGACGCCGCG 
AACGGCGAGG TGGGCCAACC GGCGCGGTCC TACCGGGACC GGGACGCTAC TTCGCGAGAG 
TGA

Protein sequence

MAEQLELAYA GMASFGHRPF LTEVEQLDSW RPDAAIVGAP FDVGTTNRPG ARFGPRAIRA 
TAYEPGTYHM DLGLEIFDWL EVVDFGDAYC PHGQTEVSHN NIRERVHMLA SRGIVPVVLG 
GDHSITWPAA TAVADVHGYG NVGIVHFDAH ADTADEIEGN LASHGTPMRR LIESGAVPGS 
HFVQVGLRGY WPPRDTFDWM LEQKMTWHTM QEIWERGFKA VMADAVGEAL AKADKLYVSV 
DIDVLDPAHA PGTGTPEPGG ITSADLLRMV RQLCYEHDVA GVDVVEVAPA YDHAELTVNA 
AHRVVFEALA GMAARCRDAA NGEVGQPARS YRDRDATSRE