Gene Noca_2026 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_2026
Symbol
ID	4598648
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	2171263
End bp	2172630
Gene Length	1368 bp
Protein Length	455 aa
Translation table	11
GC content	71%
IMG OID	639776630
Product	hypothetical protein
Protein accession	YP_923223
Protein GI	119716258
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCACAG CACGCGAGTT GGCCGACCTG TCGGAGGAGC GGATCCTCGA CCTGGCCGGC 
GCGTGCTCGG AGACCATCCG CGACGCCGAG ACCGAGCTGC TCCGGCTGGC GTATCAGTGG 
GCGATCGTGC ACCCGGCGAA CCGGCTCGAC CCGGTCGAGG CCGACCAGCC TGGTCGCGAA 
CGCGCTCGCC AGCTCGGCGG TGAGGGCACC CCGCGGGTCG CCGAGTTCGC GGCGGCGGAG 
TTCGGGGCCC GGATCGGCCG CTCGCCGTAT GCGGCGGCGT CTCTGATCGG GGACGCGCTG 
GACTTGGAGC ACCGGTTCCC GCGCCTGTGG GCGCGGGTCG AGGCCGGTGA GGTGCGCGCC 
TCCTATGCCC GCTACGTCAC CACCAAGACC CGGACCCTCA CCGCCGAGCA GGCGGCCTAC 
GTCGATGCTC GCGTCTTCGA GTCCGCGGAC GGGCGGCTGC CCTGGTCCCG GTTCGAGGAG 
CTGGTGGCCG GCACGGTCGC CCAGGCCGCC CCCGAGGCGG CCCGGGAGAA GGAGGAGCGC 
GCCGCCAAGG CGAGGTTCGC CAAGAAGGTC CGCCGCACCG TCGCCGACGA GACCCACGGG 
ATGGCCTCGT TCCTGGTGCA CGCCGACCTG CCCACCATCG AGGCCATCGA CGACTACGTC 
ACCCAACGAG CCAAGCAGCT CGCCGACACC CTGCCCGACG CCCCCCACCT GGCCACCGAG 
GATGACCGGC GGGTGCACGC GTTCCTGCTG CTGGTCTCCG GCGCGCCGGC CGACACCGAC 
CTGGCGGATC TGTTGCCGCA GGTGTGCCTG TACGTGCACA CCTACGCCGA CCCCGGCGCC 
GACCGCACCC AGAGTTCCGA GGGGATCGTC CGGGTCGAGG GCCATGGTCC GGTCACCCAG 
GAGTGGGTCC GCCGGTTCCT CGGCCCGCAC GCCCGGTTCA CGATCCGTCC GGTCCTCGAC 
CTCGCCGGCC AAGCCCCGGT GGATTCCTGG GAGATCCCCG ACCGACATAG GCGGGCCGTG 
CATCTGATGA CGCCGGCCGA CACCTTCCCC TTCGCCTCCT GCACCTCACC GGGCATGCAG 
GTCGACCACA CCATCCCCTA TCACCAGGGT GGTGTCAGCG GGGTGGGCAA CTACGGGCCG 
ATGACCACCC TGCACCACCG GATCAAGACG CATGGCGCGG GTTGGCAGGT CAAGCAGCCG 
TTCCCCGGCA TCTATATGTG GCGTGACCCC CACGGCGGCT TCTACCTCGT CGACCACACC 
GGCACCCGCC GACTCCCCGG AACCCGACGC CCCCTGGTCG TCGAGCTCTG GCACCCACCC 
GCCGGCATCG AGATCGCTCT TGCCGACGAC TACACGCCCG CCGCCTAA

Protein sequence

MSTARELADL SEERILDLAG ACSETIRDAE TELLRLAYQW AIVHPANRLD PVEADQPGRE 
RARQLGGEGT PRVAEFAAAE FGARIGRSPY AAASLIGDAL DLEHRFPRLW ARVEAGEVRA 
SYARYVTTKT RTLTAEQAAY VDARVFESAD GRLPWSRFEE LVAGTVAQAA PEAAREKEER 
AAKARFAKKV RRTVADETHG MASFLVHADL PTIEAIDDYV TQRAKQLADT LPDAPHLATE 
DDRRVHAFLL LVSGAPADTD LADLLPQVCL YVHTYADPGA DRTQSSEGIV RVEGHGPVTQ 
EWVRRFLGPH ARFTIRPVLD LAGQAPVDSW EIPDRHRRAV HLMTPADTFP FASCTSPGMQ 
VDHTIPYHQG GVSGVGNYGP MTTLHHRIKT HGAGWQVKQP FPGIYMWRDP HGGFYLVDHT 
GTRRLPGTRR PLVVELWHPP AGIEIALADD YTPAA