Gene Noca_3142 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_3142
Symbol
ID	4600127
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	3345262
End bp	3346401
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	77%
IMG OID	639777748
Product	cysteine desulfurase
Protein accession	YP_924331
Protein GI	119717366
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1104] Cysteine sulfinate desulfinase/cysteine desulfurase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACCAGCG CAGACCCGGC GGGCGCTCCG CGGCGTCCGA CCTATCTCGA CTCGGCGTCC 
TCCGAGCCGC TCCACCCGGC GGCCCGGGAC ACCCTGCTCG CCGCGCTGGA GCGGGGGTAC 
GCCGACCCGC GCCGGCTGCA CGGCCCGGCC CGCGACGCCC GCCTCCTGCT CGACAACGCC 
CGCGCCGTGG TCGCCGAGTG TCTCGGGGTG CGCCCCGACG AGGTCACCTT CACGTCCTCG 
GGCACCGACG CCGTCCACCG CGGGCTCCTG GGCCTGGTGC GGGCCTCGCG CCGCGGCGAC 
GGCGTCGCCT ACTCCGCCGT CGAGCACTCC GCGGTGCTGC GGGCGGTGGC GTGGGGTGGC 
ACCGGGCACG AGGTCGGCGC GCGGCCCGAC GGGCGGGTCG ACCCCGGGCT CCTCGCCGAG 
GCCGCGGCGG CCGACGGGGT CGGGGTCGTC GCCCTGCAGA GCGCCAACCA CGAGGTCGGC 
ACGGTCCAGC CGGTCGGCGA GCTCGAGCCC CGCGACGGCG TACCGGTCTT CGTCGACGCC 
TGCGCGTCCA TGGGCCGGCT GCCACTCCCG GACGGTTGGA ACGTGGCGGC CGGGTCCGCG 
CACAAGTGGG GCGGCCCGGC AGGGGTCGGG GTGCTGCTGG TGCGCAAGGG CACCCGATGG 
CTCAACCCGT TCCCCGGGGA CGACCGGATC GACGAGCGCG CCGACGGGTT CGAGAACGTG 
CCCGCCGCCC TCGCCGCCGC GGCGGCGCTC CGGGCGGTCG TCGCCGAGCG GGCCACCGTC 
AACCCGCGCC AGCACGACCT GGTCGACCGG ATCCGCGCCG CCGCGGCGAA GATCCCCGAC 
GTCGAGGTCG TCGGCGACCC GGTCGACCGG CTCCCCCACC TGGTCACCTT CTCCTGCCTG 
TACGTCGACG GCGAGGCGCT GGTCACCGAG CTGGACCGGC GGGGGTACGG CGCGGCCAGC 
GGCTCGGCGT GCACCTCCTC GACCCTGACC CCGAGCCGGG TGCTCGAGGC GATGGGCGTG 
CTCACCCACG GCAACCTGCG GGTCTCCCTG ACCCGGGACA CCACCGAGCA GGACGTCGAG 
GGCTTCCTCG AGGTGCTGCC ACAGGTGGTC CGCGACATCC GCGCCGAGGC CGGCCTGTGA

Protein sequence

MTSADPAGAP RRPTYLDSAS SEPLHPAARD TLLAALERGY ADPRRLHGPA RDARLLLDNA 
RAVVAECLGV RPDEVTFTSS GTDAVHRGLL GLVRASRRGD GVAYSAVEHS AVLRAVAWGG 
TGHEVGARPD GRVDPGLLAE AAAADGVGVV ALQSANHEVG TVQPVGELEP RDGVPVFVDA 
CASMGRLPLP DGWNVAAGSA HKWGGPAGVG VLLVRKGTRW LNPFPGDDRI DERADGFENV 
PAALAAAAAL RAVVAERATV NPRQHDLVDR IRAAAAKIPD VEVVGDPVDR LPHLVTFSCL 
YVDGEALVTE LDRRGYGAAS GSACTSSTLT PSRVLEAMGV LTHGNLRVSL TRDTTEQDVE 
GFLEVLPQVV RDIRAEAGL