Gene Noca_4071 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_4071
Symbol
ID	4596585
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	4297203
End bp	4298351
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	72%
IMG OID	639778677
Product	thiolase
Protein accession	YP_925255
Protein GI	119718290
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.197027
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCACCG GCGCGGCGAT CGTCGGGGCC GCGGAGTCCG ACCTGGGCGT CACCGGCAAG 
TCCATCCTGA CCCTGCAGGC CCAGGCCGTG TCCCGGGCAC TGGCCGACGC CGGCCTCACC 
GTCGCCGACG TCGACGGGAT CGCCACCACC GGCATCTCCC GCTTCTCCGC CACCCAGCTC 
GCCGACTACC TCAGTCTCCG GCCCACCTGG ACCGACTCCA CCTTCGCGGG AGGGTCGGCG 
TTCGAGATGT ACGTCGCCCG GGCCGCGCAG GCGATCGCGG CCGGGCAAGC GACCACGGTC 
GTCATCTCGT TCGCATCCAA CCAGCGGTCC GCGAGGTCCC GGAGGCTGGG CGGGGTGCAC 
GAGCCCTGGA TCCCCGAGGC CCAGTTCGAG GAGCCGTACG ACCCGCTCTA TCCCGTGTCG 
TACTACGCCA TGGCCGCCCA GCAGTACTTC CATCGGTTCG GCGGCACCCG CGAGCAGCTC 
GCGGAGATCG CGGTCGCGGC ACGTGACTGG GCGCTGCTGA ACCCGCGGGC GTTCCGCTAC 
GGCGCCGGCC GGCTCTCCGT CGAGGACGTG ACCGGGTCGA CGATGATCTC CAGCCCCCTC 
GGCGTCGCCG ACTGCTGCCT GGTGACCGAT GGCGGCGGTG CCGTCGTCCT GACCTCGCTG 
GAGCGCGCCC GGGACCTGGC CCGACCTCCC GTCGAGGTCC TCGGGTACGG CGAGCGGACC 
ACCAACACCT CGTTCACCAC TGTCCGCGAC CTGACCGCCC CCGGCGCAGC GGAGTCGGCG 
GCGGACGCGT ACGCGCGAGC CGGGATCACC GCGGCCGACG TGGACGTCGT CGAGGTGTAC 
GACTCCTTCA CCATCACCGC CGCGCTCAGC GTCGAGGCGC TCGGGTTCTG TGGACGCGGG 
GAGGTGCTCG ACTTCATCCA GGACGGCCGG ATCCGGCCCG GCGGGTCCCT GCCGCTCAAC 
ACCAACGGCG GCGGGCTCTC CTACTGCCAC CCCGGCCAGT ACGGCGTGCT GCTGCTCGTC 
GAGGCCGTCC GTCAGCTGCG GGGCGAGTGC GCGGAACGGC AGGTCGCGGG CGCCGAGGTC 
GCGGTCGCGC ACGGCACCGG CGGGATCATG TCCACCCACG CGACCGTCGT CTTGGGAGTG 
GCCCGATGA

Protein sequence

MTTGAAIVGA AESDLGVTGK SILTLQAQAV SRALADAGLT VADVDGIATT GISRFSATQL 
ADYLSLRPTW TDSTFAGGSA FEMYVARAAQ AIAAGQATTV VISFASNQRS ARSRRLGGVH 
EPWIPEAQFE EPYDPLYPVS YYAMAAQQYF HRFGGTREQL AEIAVAARDW ALLNPRAFRY 
GAGRLSVEDV TGSTMISSPL GVADCCLVTD GGGAVVLTSL ERARDLARPP VEVLGYGERT 
TNTSFTTVRD LTAPGAAESA ADAYARAGIT AADVDVVEVY DSFTITAALS VEALGFCGRG 
EVLDFIQDGR IRPGGSLPLN TNGGGLSYCH PGQYGVLLLV EAVRQLRGEC AERQVAGAEV 
AVAHGTGGIM STHATVVLGV AR