Gene Noca_4474 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_4474
Symbol
ID	4596993
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	4729658
End bp	4730905
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	70%
IMG OID	639779085
Product	peptidase M24
Protein accession	YP_925658
Protein GI	119718693
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.512604
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGCCC CGAACCGACC GCTCCCGGCG CCCGGGCACA TGGCGGTCGA CTACGAGGAG 
CGGGTCGACT TCGACCGGCT GCGCCACTAC CGGCTCGGCC GGGCCCAGGC CGCGCTGGAG 
GGCAGCGAGT GCGGGGCCTT CCTGCTCTTC GACTTCTACA ACATCCGCTA CACCACGCAC 
ACCTGGATCG GCGGGGCGCT CGGCGACAAG ATGATCCGCT ACGCGCTGGT CGCGCGCGGC 
AAAGAGCCGG TGCTCTGGGA CTTCGGGTCC GCGGTCAAGC ACCACAAGAT CTACTCCCAG 
TGGGTGCCCG AGGAGAACTA CCGGGCCGGG TTCCTCGGCT TCCGCGGCGC GGTCGCCCCG 
AGCGTCGGGC TGATGGAGAC CGCGGTCGCG GAGATCAAGT CGCTGCTGGT CGAGGCCGGC 
GTCGCCGACC TCCCGGTCGG CGTGGACATC GTGGAGCCGC CGTTCCTCTT CGAGATGCAG 
CGTCAGGGCC TGACCGTCGT CGACGCCCAG CAGCTGATGC TCGACGCACG CTGCATCAAG 
TCCCACGACG AGATCGTGCT GCTCAACCAG GCCGCCGCGA TGGTCGACGG CGTCTACCAG 
GACATCGTCG AGGCGCTCAA GCCCGGCGTG CGCGAGAACG AGATCGTCGC GCTCGCCAAC 
AAGCGGCTCT ACGAGATGGG CTCGGACCAG GTCGAGGCCG TCAACGCGAT CTCCGGCGAA 
CGCTGCAACC CGCACCCGCA CAACTTCACC GACCGGCTGA TCCGCCCCGG CGACCAGGCG 
TTCTTCGACA TCATCCACTC CTTCAACGGC TACCGGACCT GCTACTACCG CACGTTCTCG 
GTCGGCAGCG CGACCCCGGC CCAGCGCGAC GCCTACACCC AGGCGCGGGA GTGGATGGAC 
CGCGGCATCG ACGGCATCCG CGCCGGCGTC GGCACCGACG AGGTGGCCGC GCTGCTGCCC 
GAGGCCGAGG AGTTCGGCTT CGGCTCCGAG ATGGAGGCCT TCGGCCTCCA GTTCGCCCAC 
GGGCTCGGCC TCGGCCTGCA CGAGCGGCCG ATCATCTCCC GGCTCAACTC GATGAAGGAG 
CCGGTCGAGC TCCAGGTCGG CATGGTCTTC GCGCTGGAGA CCTACTGCCC GGCCTCCGAC 
GGCGTCTCCG CGGCCCGGAT CGAGGAGGAG ATCGTGATCA CCGAGGACGG CCCCCGGGTG 
CTCACCCTCT TCCCGGCGCA GGACCTGGTC GTCGCCAACC CCTACTAG

Protein sequence

MSAPNRPLPA PGHMAVDYEE RVDFDRLRHY RLGRAQAALE GSECGAFLLF DFYNIRYTTH 
TWIGGALGDK MIRYALVARG KEPVLWDFGS AVKHHKIYSQ WVPEENYRAG FLGFRGAVAP 
SVGLMETAVA EIKSLLVEAG VADLPVGVDI VEPPFLFEMQ RQGLTVVDAQ QLMLDARCIK 
SHDEIVLLNQ AAAMVDGVYQ DIVEALKPGV RENEIVALAN KRLYEMGSDQ VEAVNAISGE 
RCNPHPHNFT DRLIRPGDQA FFDIIHSFNG YRTCYYRTFS VGSATPAQRD AYTQAREWMD 
RGIDGIRAGV GTDEVAALLP EAEEFGFGSE MEAFGLQFAH GLGLGLHERP IISRLNSMKE 
PVELQVGMVF ALETYCPASD GVSAARIEEE IVITEDGPRV LTLFPAQDLV VANPY