Gene Noca_2149 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_2149
Symbol
ID	4599209
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	2298450
End bp	2299478
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	64%
IMG OID	639776752
Product	4-hydroxy-2-ketovalerate aldolase
Protein accession	YP_923345
Protein GI	119716380
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0119] Isopropylmalate/homocitrate/citramalate synthases
TIGRFAM ID	[TIGR03217] 4-hydroxy-2-oxovalerate aldolase

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAACGAAA CGCGTACGAC TGTCTTTGTC CAGGACGTCA CTCTCCGCGA CGGCATGCAC 
GCCATCCGAC ACCAGCTTGC GCCCGGCGAG GTAGCCCAGA TTGCCGCAGC CCTTGATGTC 
GCAGGGGTCG ACGCCATCGA AATCTCGCAT GGCGACGGTC TCGCCGGAAG CAGCCTCAAC 
TACGGTCCCG GAAGCCATAC CGACTGGGAG TGGATCGAGG CTGCAGCTGC CAACATCCAA 
CGCGCTCGGT TGACCACGCT CCTACTTCCG GGCATCGGGA CGGTGGATGA ATTGCGCAAG 
GCGCACGACC TCGGTGTTCG CTCCGTTCGT GTCGCGACGC ATTGCACGGA AGCCGACGTT 
TCGGCCCAGC ACATCGAGAC GGCGCGCGAC CTCGGCATGG ATGTCGCAGG ATTTCTGATG 
ATGAGCCACA TGGCTGCGGC CAGCGAGCTG GCAGCCCAAG CGGCTCTCAT GGAGTCCTAC 
GGCGCCCATT GCGTCTACGT GACGGACTCG GGTGGCCGGC TGACCATGGA CGCCGTGCGT 
GACCGCGTCC GGGCATACCG TGACGTCTTG GATGCCACGA CCGAGATCGG TATCCATGCC 
CATGAGAACT TGTCTCTGTC GGTCGCTAAC AGCGTGGTTG CGGTTGAAGC GGGCGTCACT 
CGGGTCGACG CCTCGCTCGC GGGACAAGGT GCAGGTGCGG GAAACTGCCC CATCGAGGCC 
TTTGTCGCCG TGGCCAATAT CCTCGGCTGG CAACATGGCT GCGACCTCTA CCAACTGCAA 
GACGCTGCCG AGGACCTCGT TCGCCCGCTC CAAGACCGGC CTGTACGCGT GGACCGGGAA 
ACCTTGACGC TCGGCTACGC CGGCGTGTAC TCCAGCTTCT TGCGGCACGC CGAGAAGGCG 
GCTCAGACCT ACGACCTCGA CGTTCGAACC ATCCTGACCG AGGTGGGGAA TCGCCGGCTC 
GTCGGAGGCC AAGAAGACAT GATCGTCGAC ATCGCCATGG AACTGTCCGA GGTAGCGGCA 
GACCGTTGA

Protein sequence

MNETRTTVFV QDVTLRDGMH AIRHQLAPGE VAQIAAALDV AGVDAIEISH GDGLAGSSLN 
YGPGSHTDWE WIEAAAANIQ RARLTTLLLP GIGTVDELRK AHDLGVRSVR VATHCTEADV 
SAQHIETARD LGMDVAGFLM MSHMAAASEL AAQAALMESY GAHCVYVTDS GGRLTMDAVR 
DRVRAYRDVL DATTEIGIHA HENLSLSVAN SVVAVEAGVT RVDASLAGQG AGAGNCPIEA 
FVAVANILGW QHGCDLYQLQ DAAEDLVRPL QDRPVRVDRE TLTLGYAGVY SSFLRHAEKA 
AQTYDLDVRT ILTEVGNRRL VGGQEDMIVD IAMELSEVAA DR