Gene Noca_4056 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_4056
Symbol
ID	4596570
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	4278426
End bp	4279718
Gene Length	1293 bp
Protein Length	430 aa
Translation table	11
GC content	76%
IMG OID	639778662
Product	peptidase M4, thermolysin
Protein accession	YP_925240
Protein GI	119718275
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3227] Zinc metalloprotease (elastase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCTGCC GCTTCGTGCC GCCGTACCTG CTGCGCCGGG TCGCGCCCGA GAGCCTGCTG 
GTCGACGAGC GGCTGCGGAG CGGCCGGACG GTGCCGGCCG CCGACCGGCG CTCGGTCCTG 
CCGGCGGGCG GTGCGGCGTG GACCGTGCAC ACCGCGGACC ACACGACCAC CCTGCCGGGG 
CAGGTGGTGC GGTCGGCCGG CGATCCCGAG GTCGGTGACG CCGCCGTCGA CGAGGCGGCC 
TCCGGCATCA CCGGGGCGCT CGCGCTGTTC GCGGAGGTCT ACGGCCGCTC GTCGTACGAC 
GGGGCCGGCG CGCCGGTCAG CCTGACGGTC CACTACGGCC GCGACTACGA CAACGCGTTC 
TGGGACGGCA CGCAGCTGGT GTTCGGCGAC GGGGACGGCC GGGTCTTCGG CCGGTTCACC 
GCTCCGGTGG ACGTCCTCGG GCACGAGCTC ACGCACGCGG TCACCGAGCA CACCGCCGGG 
CTGCGCTACC GCGATCAGCC CGGCGCGCTG AACGAGTCGG TCTCCGACGT CTTCGCGGCC 
TGCCTCAAGC AGCGGCTGCT CGGGCAGACC GCGGCCGAGG CCGACTGGCT GATCGGCGCC 
GGGATCTTCC TGCCCGGCAT CCACGCCCGC GCGCTGCGCG ACATGGCCGC GCCCGGCACG 
GCGTACGACG ACCCCGCGCT GGGTCGCGAC CCCCAGGTGG GCCACCTGCG CGACTACGTC 
GACACCGCCG ACGACAACGG CGGCGTGCAC CTCAACTCGG GCATCCCCAA CCGGGCCTTC 
CAGCTCGCCG CGACCGCCAT CGGCGGCTCG ACGTGGGACG GCGCCGGCCG GGTCTGGTAC 
GACGCGCTCG TCGGCGGCGC CGTCGGCGCG GGCACGGACT TCGCGGGCTT CGCCGCCGCG 
ACGGTCGCCG CCGCGGGCGC GCACGCCGAG GCGGTGCGCG GTGCGTGGGC GGAGGTGGGG 
GTCACGCCGG AGGGTGGTGT CGTTCCGGCC GGGGCGGGGT CAGCCGGCGG GTCAGCAGGT 
GGGTCGCGGC GGGTGAGCGT GCGGCGTACC GGCGGCTTCG CGGGCCTGCG CGCCGCCGGC 
GAGCTCGACC TCGACGGCGA CGACCCGCGG GCCGCGGAGG TCGCCGACCT GGTCGACCGG 
GTGGACCTGG GCGTCGTGGC CCCCGGCGAC CCACAACCCG ACCGGTACGT CTACTCCTTC 
GACCTCTGCG GCTCCTGTGC CACCGTCCCC GAGCAGCACC TCACCCCCGA CCTCGCCCGC 
CTGGTGGAGC TGCTCCTGGA CGGTAGTCCC TGA

Protein sequence

MSCRFVPPYL LRRVAPESLL VDERLRSGRT VPAADRRSVL PAGGAAWTVH TADHTTTLPG 
QVVRSAGDPE VGDAAVDEAA SGITGALALF AEVYGRSSYD GAGAPVSLTV HYGRDYDNAF 
WDGTQLVFGD GDGRVFGRFT APVDVLGHEL THAVTEHTAG LRYRDQPGAL NESVSDVFAA 
CLKQRLLGQT AAEADWLIGA GIFLPGIHAR ALRDMAAPGT AYDDPALGRD PQVGHLRDYV 
DTADDNGGVH LNSGIPNRAF QLAATAIGGS TWDGAGRVWY DALVGGAVGA GTDFAGFAAA 
TVAAAGAHAE AVRGAWAEVG VTPEGGVVPA GAGSAGGSAG GSRRVSVRRT GGFAGLRAAG 
ELDLDGDDPR AAEVADLVDR VDLGVVAPGD PQPDRYVYSF DLCGSCATVP EQHLTPDLAR 
LVELLLDGSP