Gene Noca_4246 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_4246
Symbol
ID	4596760
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	4483859
End bp	4484809
Gene Length	951 bp
Protein Length	316 aa
Translation table	11
GC content	79%
IMG OID	639778852
Product	dipeptidyl aminopeptidases/acylaminoacyl-peptidases-like
Protein accession	YP_925430
Protein GI	119718465
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1506] Dipeptidyl aminopeptidases/acylaminoacyl-peptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.760723
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCTGGGGC GGATCAAGGC CCGCTACGGT CGGCCGGCGG TACGCCGGGG GCTCGCGGCA 
CCGGTCGGGC TGGTCGCCAC GGACGTGAGC CTGCTCGGCC TCGACGGCGG GACGCTGCGG 
GGCTGGTTCT GCCGCCCCGA CGGCGGCCTC GACGGCGGCC CCGACGCCCC CGACGGCGGA 
CCCGACTCCC CCGGCGACGG ACCCGACGAC GGTCTCGACG ACGGACCCGA CGACGGACCC 
GACGACGCCC CCGACGCCCC TGACGACGGC CCGGACGGCC GCCCCGGTGC CCCCGGCGCG 
GTGGTGCTGC ACGGCTGGGG CGGCGCGGCG GCGGACATGG CCCCGGTCGC CCAGCCGTTG 
ATCGAGGCTG GCGTCCACGC CCTGCTCCTG GACGCCCGGT GTCACGGCCG CAGCGACGAC 
GCGGAGTTCA CCTCGATGCC GAGCTTCGCC GCGGACCTGG CGGCCGGCGT CCGGTGGCTG 
CGCGAGCAGC CCGGCATCGA CCCCGACCGG GTCCTGCTCG TGGGCCACTC CGTGGGCGCC 
GGGGCGTGCC TGCTGGCGGC CCGCGAGGAC CCGCGCATCG CCGCGGTGAT CAGCCTCTCC 
TCGATGGCGG ACCCGCGGGA GGTGATGGCC CGGCTGCTGA CCGGCGGCGG CGTCCCGCGC 
CCGCTCGTCC CGGTCTCGCT GCGGGTGGTG GAGCACGTCA TCGGGGCCCG GTTCGCCGAC 
TTCGCGCCGC TCGCCACGGT GGCGGCCCTC GACGTCCCGG TCCTGCTGGC GCACGGGGTC 
CGGGACGCCG TGGTCCCGGT CGCGGACGTC CACCGGTTGG CCGCCGTCGC GCGCGACGCC 
ACCGTGCTGG AGCTGCCCGA TGCCGGGCAC GCGGAGCCGG TCGACACCAC GGTGCTGGCC 
GACGCGCTGC GCGCGTTCGC GCGCCGCACC GTCGCCGGCC ACCCGGGCTA G

Protein sequence

MLGRIKARYG RPAVRRGLAA PVGLVATDVS LLGLDGGTLR GWFCRPDGGL DGGPDAPDGG 
PDSPGDGPDD GLDDGPDDGP DDAPDAPDDG PDGRPGAPGA VVLHGWGGAA ADMAPVAQPL 
IEAGVHALLL DARCHGRSDD AEFTSMPSFA ADLAAGVRWL REQPGIDPDR VLLVGHSVGA 
GACLLAARED PRIAAVISLS SMADPREVMA RLLTGGGVPR PLVPVSLRVV EHVIGARFAD 
FAPLATVAAL DVPVLLAHGV RDAVVPVADV HRLAAVARDA TVLELPDAGH AEPVDTTVLA 
DALRAFARRT VAGHPG