Gene Noca_0040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_0040
Symbol
ID	4600091
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	45212
End bp	46573
Gene Length	1362 bp
Protein Length	453 aa
Translation table	11
GC content	68%
IMG OID	639774655
Product	MmgE/PrpD family protein
Protein accession	YP_921277
Protein GI	119714312
COG category	[R] General function prediction only
COG ID	[COG2079] Uncharacterized protein involved in propionate catabolism
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGGACTG TCTTGAGCAC CTACACCGAG CAGCTGGCCG AGTACGTCAC CGCCACGACC 
TACGACGCGC TGCCCACCTC GACCGTGGCC GCCGCCAAGC GCGTGACGCT CGACCTGATC 
GGCGTCGTCC TGCCGGCCAT CAACTACGGC CCCGGCAGCG TGATGAACCA GTACGTGCGG 
GAGACCGGCG GCCCCGGTCA GGCCACCGTC GTCGGCACCG ACATCAAGAC GAACGCCGCC 
AACGCCGCCC TCGCCAACGG GACGATGGCG GCGGACATGG AGCAGGACGA CGTCCACCCC 
GAGTCGAACC TGCACGCGAG CAGCGTCTTC GTCCCGGCGA TGCTGGGCGT TGCCGAGGAG 
CTCGGTTCCT CGGGCCGCGA CTGGATCAAC GCCCTGGCCG TCGCCTACGA CGTCGGCTGC 
CGGATCTCCA TCGCGATGGA CAACGGCCGG CAGTACGCGA GCGGCTTCCA CCCGACGGCA 
GTCTCCGGCA CCTTCGGTGC CGCGGCCGCG GTGGCACGGC TCCTCGGCCT CGACGCCGCC 
GGTGTCAACA GCACCATCGG TCTCACCGGC TGCCAGGCGG CCGGCATGCT CACCTGGGAG 
ATGGAGACCG AGCACTACAC CAAGTCCTTC CAGAGTGGGG TTCCGGCGCG CAACGCGGTC 
GTGGCCGCGC AGCTCGCCGC CCGGGGCTAC GTCGGCGCCA GCAACACCCT CGACGGGAAG 
TACAACGTCT TCGACGCGTT CTCCAACCAC CGGAACTTCT CGCGGCTGGT GGAGAACCTC 
GGCGACCGCC ACGAGATCGA GTACACCGGG TACAAGTTCT ACTCGGTGTG CCGCTTCATC 
CACTCAGCCA TCGACCAGTT GCTCGATCTG TCCGCGGAAC ACGGTTTCGC GGGCGCCGAC 
ATCGAGAGCC TCGACGTCTG GCTGCCGCAC ACGCAGGTGC CGATCGTCGA CCACAACACG 
CTGATCACCC ACAACCTCCA GTACTCGCTC GCGGTGGGTA TCACCGACCG GGTCGTCGAG 
CGCGCACAGA CCTCGAACGA GCGCTTCGCG GACCCCGCGC TGCAGGCGAT CGCGGCGAAG 
GTGACCCTTC GCGGGGCCGA CGACCTGGAG GCCCTCTACC CCGCCCACTG GCCCTCGCGC 
GTGCACATCC GCCTCACCGA CGGCCGGACC TTCGACAGCG AGAAGCACGA CCCGCGGGGC 
ACCTCGTTCG TACCGGTGAC CGACGCTGAC ATCGTCGCGA AGTTCGAGGG CATGGCCTCC 
CAGGTCCTGC CCGCAGAGCG GGTCAACCAG ATCGTCAAGA TCGTCGACGA GCTCGAGACC 
CTCGACTCCA TCCGCGAGCT AACGGCCCTG CTGGTGCCGT GA

Protein sequence

MRTVLSTYTE QLAEYVTATT YDALPTSTVA AAKRVTLDLI GVVLPAINYG PGSVMNQYVR 
ETGGPGQATV VGTDIKTNAA NAALANGTMA ADMEQDDVHP ESNLHASSVF VPAMLGVAEE 
LGSSGRDWIN ALAVAYDVGC RISIAMDNGR QYASGFHPTA VSGTFGAAAA VARLLGLDAA 
GVNSTIGLTG CQAAGMLTWE METEHYTKSF QSGVPARNAV VAAQLAARGY VGASNTLDGK 
YNVFDAFSNH RNFSRLVENL GDRHEIEYTG YKFYSVCRFI HSAIDQLLDL SAEHGFAGAD 
IESLDVWLPH TQVPIVDHNT LITHNLQYSL AVGITDRVVE RAQTSNERFA DPALQAIAAK 
VTLRGADDLE ALYPAHWPSR VHIRLTDGRT FDSEKHDPRG TSFVPVTDAD IVAKFEGMAS 
QVLPAERVNQ IVKIVDELET LDSIRELTAL LVP