Gene Noca_1649 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_1649
Symbol
ID	4600028
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	1751756
End bp	1752775
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	72%
IMG OID	639776248
Product	4-hydroxy-2-ketovalerate aldolase
Protein accession	YP_922849
Protein GI	119715884
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0119] Isopropylmalate/homocitrate/citramalate synthases
TIGRFAM ID	[TIGR03217] 4-hydroxy-2-oxovalerate aldolase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.264755
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAACGCAC ACCAGATCTT CGTCCAGGAC GTCACGCTGC GCGACGGGAT GCACGCCGTG 
CGGCACCGGA TCGGGCTCGA CGACGTGCGC CGCATCGTCG CCGCGCTCGA CGCCGCCGGC 
GTCGACGCCA TCGAGGTCGC CCACGGCGAC GGCCTCGCCG GCTCCTCGGT GAACTACGGA 
CCCGGATCCC ACACCGACTG GGAGTGGATC GAGGCCGCGG CCGACGTGCT CGAGCGGGCC 
CGCCTGACCA CGCTGCTGCT ACCCGGGGTC GGCACCATCC ACGAGCTCAA GACCGCCTAC 
GACCTCGGGG TCCGCTCGGT CCGGGTCGCC ACGCACTGCA CGGAGGCCGA CATCTCCGCC 
CAGCACATCA CCGCGGCCCG GGAGATCGGC ATGGACGTCT CCGGCTTCCT GATGCTCTCC 
CACATGGCGC CGCCGGCGGA GCTCGCCAAG CAGGCCCTGC TCATGGAGTC CTACGGTGCG 
CACTGCGTCT ACGTCACCGA CTCCGGCGGC CGGCTCACGA TGAACGACGT CCGCGACCGG 
GTCGCGGCGT ACCGAGACGT CCTCGACCCT GCCACCGAGA TCGGCATCCA CGCCCACGAG 
AACCTCTCGC TCTCGGTCGC CAACTCCGTC GTGGCCGTCG AGACCGGTGC GGTGCGGGTC 
GACGCCTCCC TCGCCGGGCA CGGTGCCGGC GCCGGCAACT GTCCGATCGA GGCGTTCGTC 
GCGGTGGCGA ACCTCTCCGG CTTCGAGCAC GGCTGCGACC TGTTCGCGCT GCAGGACGCC 
GCCGACGACC TGGTCCGCCC GTTGCAGGAC CGCCCGGTCC GGGTGGACCG CGAGACCCTC 
ACCCTCGGCT ACGCCGGGGT CTACTCCTCG TTCCTACGGC ACGCCGAGCG GGCCGCCGAT 
CAGTACGGCG TCGACGTGCG CGAGCTGCTG ATGGAGTGCG GCCGGCGCGG CCTGGTCGGT 
GGCCAGGAGG ACATGATCAT CGACATCGCG CTCGATCAGG TCGGCGCCGT CGCCAGCTGA

Protein sequence

MNAHQIFVQD VTLRDGMHAV RHRIGLDDVR RIVAALDAAG VDAIEVAHGD GLAGSSVNYG 
PGSHTDWEWI EAAADVLERA RLTTLLLPGV GTIHELKTAY DLGVRSVRVA THCTEADISA 
QHITAAREIG MDVSGFLMLS HMAPPAELAK QALLMESYGA HCVYVTDSGG RLTMNDVRDR 
VAAYRDVLDP ATEIGIHAHE NLSLSVANSV VAVETGAVRV DASLAGHGAG AGNCPIEAFV 
AVANLSGFEH GCDLFALQDA ADDLVRPLQD RPVRVDRETL TLGYAGVYSS FLRHAERAAD 
QYGVDVRELL MECGRRGLVG GQEDMIIDIA LDQVGAVAS