Gene Noca_4378 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_4378
Symbol
ID	4596896
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	4628107
End bp	4629318
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	76%
IMG OID	639778988
Product	cupin 4 family protein
Protein accession	YP_925562
Protein GI	119718597
COG category	[S] Function unknown
COG ID	[COG2850] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.123622
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGCGCGC TCGACCGGCC CGCCCTGGAC CCGCCTGCCC GCGAGCTGCC TGCCCGGGAG 
CTGCCTGCCC TCGAGTTGTT GAGCGGTGAC GCCCAGACCT TCCTGGCGAA GGTCTGGGCG 
TCGCGCGTGC ACCTGCACCG CAGCGGCCCC GCCGACCCCG ACAGCCCCGG CAGCGCCGAC 
GGCCCGGACA GCCTGGTCGG GCTGTTCGCG CTCGCCGACG CCGACCACCT GCTGACCTCG 
AGCGCCGTCC GGACGCCGTC GATCCGGCTG GCCAAGGACG GCGCGGTGCT CCCGGAGTCG 
GCGTACACCC GACGGGCGAG CCTCGCCGGC AAGCCGCTGA CCGGGCTGGT CGACGCCCGC 
AAGGCGCTGG CGCTCTTCGA CGACGGCGCG ACCGTCGTCT TCCAGGGCCT GCACCGCTAC 
TGGCCCCCGC TGACCCGGCT GATCGCCCGG CTCGAGCTCG AGCTGGGCCA CCCGTGCCAG 
GCCAACGCGT ACCTCACCCC GCCGGGCGCG CAGGGCTTCG CGGTGCACTC GGACTCCCAC 
GACGTGTTCG TGTTCCAGAC CGCCGGCTCG AAGCGCTGGG AGGTGCACGG GCCGGACGGC 
CCCGAGGAGG TGCTGCTCGA GCCCGGGGTG TCGATGTACC TGCCGACCGG CACGCCGCAC 
GCGGCCCGTG CCCAGGACAC CGTCTCCTTG CACGTCACGC TCGGCATCAA CCAGCTCACC 
TGGCGCGGCC TGGTCGAGCG GACCGTGGCC GGGGCCCTCG GCGAGGTGGC CGACGAGCAC 
CTGCCGGCCG GCTACCTCGA CGACCCGGCC GCGCTCGCCG GCCCGCTCGC GGACCGGCTC 
GAGCGACTCG CGGACGCCGT CCGCCGCCTG GACGCGACCG CCGCCGTCGA GGCCGAGGTG 
CGGCGGTTCC TCACCTCGCG GCCGCCGCGC CTGGACGGCG GGCTGCACGA CGTGCTCGCC 
CACGGCACGA TCACCGACAC CACCCTGCTG CGCCGCCGGC CCGGCCACCC CTGCGTGCTC 
CTCGACCGGG GTGAGCGGGT CGAGGTGCTG CTCGGCGACC GGTCGCTGAC CGTGCCCGCG 
TGGATCCGCC CGGCACTCGA GGCGGTCCGC GCTCGCGGCG AGCTGACGCC GGCCGACCTG 
CCGCTCGACG AGCAGAGCCG CCTGGTGCTG TGCCGACGAC TGGTCCGGGA GGGCCTCCTG 
GAGGTCCGGT GA

Protein sequence

MSALDRPALD PPARELPARE LPALELLSGD AQTFLAKVWA SRVHLHRSGP ADPDSPGSAD 
GPDSLVGLFA LADADHLLTS SAVRTPSIRL AKDGAVLPES AYTRRASLAG KPLTGLVDAR 
KALALFDDGA TVVFQGLHRY WPPLTRLIAR LELELGHPCQ ANAYLTPPGA QGFAVHSDSH 
DVFVFQTAGS KRWEVHGPDG PEEVLLEPGV SMYLPTGTPH AARAQDTVSL HVTLGINQLT 
WRGLVERTVA GALGEVADEH LPAGYLDDPA ALAGPLADRL ERLADAVRRL DATAAVEAEV 
RRFLTSRPPR LDGGLHDVLA HGTITDTTLL RRRPGHPCVL LDRGERVEVL LGDRSLTVPA 
WIRPALEAVR ARGELTPADL PLDEQSRLVL CRRLVREGLL EVR