Gene Noca_4393 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_4393
Symbol
ID	4596911
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	4645202
End bp	4646293
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	69%
IMG OID	639779003
Product	HpcH/HpaI aldolase
Protein accession	YP_925577
Protein GI	119718612
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2301] Citrate lyase beta subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGGAT CGCGCAGCGC CAAGGACTTC TTCCGACCTC TCGCGGTGGG TGCCCCGGCG 
CCCCTGACCG AGATCCCGGC CCGGCCGAGC CGGGCGATCC ACTTCTTCGA CCCGAGCAAC 
CCCAAGATGG CAGCGAAGGT CCCCGACCTG GTCGGCAAGG TGGACGTGCT GCTCGGCAAC 
CTCGAGGACG CGATCAAGGC CGACAACAAG GAGGCCGCCC GCGCGGGCCT GGTCGAGATC 
GCCGAGGACA CCGACTTCGG TCCCACCCAG CTGTGGACCC GGATCAACGC ACTGGACAGC 
CCGTGGGTGC TCGACGACCT CACCACGCTC GTCCCCGCGA TCGGCGCCAA GCTCGACGTG 
ATCATGGTGC CGAAGGTGCA GGGCGCCGAG GACATCCACT ACGTCGACCG CCTCCTCGCC 
CAGCTCGAGG CCAAGGCCGG GCTCGACCGC CCGATCCTGG TGCACGCGAT CCTCGAGACC 
GCCCGCGGCG TCGCGAACGT CGAGGAGATC TGCGCAGCGA GCCCCCGCAT GCAGGGCCTC 
AGCCTCGGCC CGGCCGACCT CGCGGCCGAC CGCCGGATGA AGACCACCCG CGTCGGAGGC 
GGCCACCCGG GCTACCTGGT GCGCCAGGAC CCGCCCAAGA ACGACCTCGG AGTCGCCGAC 
ATCGAGGCCA AGCGCGCGAC CTTCCAGCAG GACCTGTGGC ACTACACGAT CTCCCGGATG 
GTCGACGCCT GCGCGATGAA CGGGATCTAC CCCTACTACG GCCCGTTCGG CGACATCGCC 
GATGTCGTGG CCTGCGAGGA CCAGTTCCGC AACGCCTTCC TGCTCGGCTG CGTCGGGACC 
TGGAGCCTGC ATCCCAAGCA GATCGAGATC GCCAACCGGG TGTTCAGCCC CAGCATCGAG 
GACGTCACCC ACGCGCGACG GGTCGTGGCC GCGATGGGCG ACGGCACCGG CGCGGTGATG 
CTCGACGGCA AGATGGAGGA CGACGCCTCC GTCAAGCAGT GCCTGGTGAT GGTCGAGCTC 
GCCGAGCAGC TGGCCGCGAT CGACCCCGAG CTGAAGAAGG CGTACGACGC GATCGAGGTC 
GACCAGGCAT GA

Protein sequence

MTGSRSAKDF FRPLAVGAPA PLTEIPARPS RAIHFFDPSN PKMAAKVPDL VGKVDVLLGN 
LEDAIKADNK EAARAGLVEI AEDTDFGPTQ LWTRINALDS PWVLDDLTTL VPAIGAKLDV 
IMVPKVQGAE DIHYVDRLLA QLEAKAGLDR PILVHAILET ARGVANVEEI CAASPRMQGL 
SLGPADLAAD RRMKTTRVGG GHPGYLVRQD PPKNDLGVAD IEAKRATFQQ DLWHYTISRM 
VDACAMNGIY PYYGPFGDIA DVVACEDQFR NAFLLGCVGT WSLHPKQIEI ANRVFSPSIE 
DVTHARRVVA AMGDGTGAVM LDGKMEDDAS VKQCLVMVEL AEQLAAIDPE LKKAYDAIEV 
DQA