Gene Noca_3224 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_3224
Symbol
ID	4599162
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	3424882
End bp	3425883
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	73%
IMG OID	639777830
Product	agmatinase
Protein accession	YP_924413
Protein GI	119717448
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0010] Arginase/agmatinase/formimionoglutamate hydrolase, arginase family
TIGRFAM ID	[TIGR01227] formimidoylglutamase [TIGR01230] agmatinase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.583379
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCCGGT ACGGCGCCCA GTTCGGTCCC GACATCACCT TCCTCGGGGT CGACCCGATC 
GACCTCGACG ACGCCGACGG GCTGGCCGCC GCCGACGTGG TCGTCCTCGG TGCGCCGTTC 
GACGGCGGCA CCTCGCACCG GCCCGGCACC CGGTTCGGGC CCAGCGCGAT CCGGCAGACC 
GACTACCTGC CCCAGGACGG ATCGCGGCCG CACCTCGCGC TGCGGGTCGA CGCCCTGCGC 
GACCTGCGGG TGGTCGATGC GGGCGACGTC GAGATGCCGC CCGGAGACAT CACCCGGGCC 
CTCGGCAACC TCGAGGAGGC CGTCTACGCC GTCGCTCGCT CCGGTGCCGT CCCGCTGGTC 
CTCGGCGGCG ACCACTCGAT CGCGCTCCCC GATGCGACCG GGGTGGCCCG CCACCTCGGC 
TTCGGCCGGG TCTCGATGAT CCACTTCGAC GCGCACGCCG ACACCGGCCA CATCGAGTTC 
GGGTCGCTCT ATCGCCACGG CCAGCCGATG CGCCGGCTGA TCGAGTCGGG CGCGCTGCGC 
GGGGACCGGT TCCTCCAGAT GGGGCTGCGC GGCTACTGGC CCGGCCCCGA GACGCTCGAC 
TGGATGGCGG CGCAGCACAT GCGCTCCTAC GAGATGACCG AGATCGGCCG GCGCGGCCTC 
GAGGAGTGCC TGGACGAGGC CTTCGAGATC GCCCTCGACG AGTGCGATGC GGTCTTCCTC 
TCCGTCGACA TCGACGTGTG CGACCCCGGC CACGCACCCG GCACCGGCAC GCCGGAGCCC 
GGTGGGCTCT CCAGCCGCCA GCTCCTGGAC GCGGTCCGCC GGATCTGTCG CGAGCTCCCG 
GTCGCCGGCA TCGACGTGGT CGAGGTGTCC CCGCCGTACG ACCACGCCGA GATCACCGCG 
TACCTCGCCA ACCGGGTCTG CCTCGAGGCC CTCTCCGGCC TGGCGGCCCG CCGCCACGGC 
ATCTCGCACG ATCCGGCCGG CCCGCTGCTG GAAGGTCGCT GA

Protein sequence

MTRYGAQFGP DITFLGVDPI DLDDADGLAA ADVVVLGAPF DGGTSHRPGT RFGPSAIRQT 
DYLPQDGSRP HLALRVDALR DLRVVDAGDV EMPPGDITRA LGNLEEAVYA VARSGAVPLV 
LGGDHSIALP DATGVARHLG FGRVSMIHFD AHADTGHIEF GSLYRHGQPM RRLIESGALR 
GDRFLQMGLR GYWPGPETLD WMAAQHMRSY EMTEIGRRGL EECLDEAFEI ALDECDAVFL 
SVDIDVCDPG HAPGTGTPEP GGLSSRQLLD AVRRICRELP VAGIDVVEVS PPYDHAEITA 
YLANRVCLEA LSGLAARRHG ISHDPAGPLL EGR