Gene Noca_1843 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_1843
Symbol
ID	4597163
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	1967130
End bp	1968479
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	73%
IMG OID	639776442
Product	MmgE/PrpD family protein
Protein accession	YP_923041
Protein GI	119716076
COG category	[R] General function prediction only
COG ID	[COG2079] Uncharacterized protein involved in propionate catabolism
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.279739
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAGACA TCCTCGACAC CATGACCGAG TGGGCCGCGG AGCTCACCTG GGACGACCTG 
CCCGAGGAGG TCCGGGAACG GGCCGGCTTC GCGCTGACCG ACACAGTGTC CACGATGGTC 
GGCGGCGCTC CGACCGCGGC GGCGGTCATC GCGCTCGACT ACGCCGCCAC GGCCGGCGGC 
TCCGCGCCGC TGGTCGGGCG GGGGGCCGCG ACCACCCCGG CCAACGCGGC CTTCGGCAAC 
GGCGTCGCGG CGAGCGCGCT CGACTTTGAC GACGGGCACT ACCTCGCGGG CGCCATCCAC 
CCTGGTTCCG TGATCGTCCC GGCGGTGCTC GCGGTCGCCG ACTCCGTGAC CACGGTCGCC 
GACGCACTCG TCGCGCAGGT CGTCGGCTAC GAGATCGGCC TGCGGGCCGC GGCGATGCTC 
TGGCCCAAGC ACGACCTGGA CCACTACCAC GCCACCGGCT GCGCCGGAGC GATCGGCGCC 
GCGGCCGCGG CCGCCAAGCT GCTCGGGCTG GACGCCGACG GCCTCGCTTG CGCGATCAAG 
ATCTCCTGGC TGCACGCACC GATGTCGACC TTCGGCACGC CGATGGTCAA GGAGTCGATC 
GGCTGGGGTG CGTCCACGGG CGTCGCGGCG GCACAGCTCG CCGAGGCCGG CTTCATGAAG 
GTCCCGGAGG GCTACGACAT CCCGGCCAAC GAGGTGCTCC CGCCGTCGCC GTTCCACCAG 
CCAGGCGCGG CCGAGGACCC CTTCGTGACC AGCATCGGCA CCCGCTACGA GGTGCTGCAC 
ACCTACTTCA AGTCCTTCGG CGCGTGCCGC TACACGCACG CCGCCGGAGC GGGCCTGCTC 
TCCCTGCTCG CCGAGCACGG CATCGCCGCG GCCGACATCG CCCGCATCCG GGTGGGCACG 
CACAAGGCGG CGACCTTCCT CGACGAGGTG GCGCCCAGGA CCATCGACAC GGCGCAGTAC 
AGCTTCCCGA TCGTGCTCGC CTCGCTCGCT CTGTGGGGCG CTGCTGGAGC CGAGGAGATG 
GACGCGTCCC GGCTCGACGA CCCGGAGCGG CTCGCGCTCG CCGGCAAGTT CAGCCTCGAG 
CACGACGCCG ACCTCGACCA GCACTACCCG GCGCGCTACC CGAGCCGGGT CGAGGTCGAG 
ACGACCGACG GCCGTACCGT TCGCGGCGTC TACCTGGACG GTCCCGGCGA CCCGGGCACC 
TCGTTCGGAC CGGCCGAGCT CAGGCAGAAG TGGCAGCGGC TTCTCGGCGC GATGCTCGGC 
GAGACGGGCG CCCAGGGTGT GCTGACCGGA CTCGGCGACC CCACGTCGAC GCTGCACGCC 
GTCCTGGTGC CCGTGTGGGG GAGCAAGTGA

Protein sequence

MTDILDTMTE WAAELTWDDL PEEVRERAGF ALTDTVSTMV GGAPTAAAVI ALDYAATAGG 
SAPLVGRGAA TTPANAAFGN GVAASALDFD DGHYLAGAIH PGSVIVPAVL AVADSVTTVA 
DALVAQVVGY EIGLRAAAML WPKHDLDHYH ATGCAGAIGA AAAAAKLLGL DADGLACAIK 
ISWLHAPMST FGTPMVKESI GWGASTGVAA AQLAEAGFMK VPEGYDIPAN EVLPPSPFHQ 
PGAAEDPFVT SIGTRYEVLH TYFKSFGACR YTHAAGAGLL SLLAEHGIAA ADIARIRVGT 
HKAATFLDEV APRTIDTAQY SFPIVLASLA LWGAAGAEEM DASRLDDPER LALAGKFSLE 
HDADLDQHYP ARYPSRVEVE TTDGRTVRGV YLDGPGDPGT SFGPAELRQK WQRLLGAMLG 
ETGAQGVLTG LGDPTSTLHA VLVPVWGSK