Gene Noca_3286 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_3286
Symbol
ID	4599148
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	3493505
End bp	3495163
Gene Length	1659 bp
Protein Length	552 aa
Translation table	11
GC content	76%
IMG OID	639777892
Product	Dak phosphatase
Protein accession	YP_924475
Protein GI	119717510
COG category	[R] General function prediction only
COG ID	[COG1461] Predicted kinase related to dihydroxyacetone kinase
TIGRFAM ID	[TIGR03599] DAK2 domain fusion protein YloV

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAACTC CCCGCAGCGG CGCCATCACG TTGGAGGTGG TGCTGCGATT CGTCGACATC 
GCCACCGACG CGCTGGCCGA CGCCCGCGAG GAGATCGACG CGCTCAACGT CTACCCGGTC 
CCCGACGGCG ACACCGGCAC CAACATGTAC CTCACGGTCT CGGCGGCCCG CGACGCCGTG 
CGCGAGGCGA CCGGGGGAGA CCCGGCCTCC GACCTGGGTA CGGCGCTCGC CGCGTTCAGC 
CGGGGCGCGC TGCTCGGCGC CCGCGGCAAC TCCGGGGTGA TCCTCAGCGA GATGCTCGGC 
GCGATCGCGC GGCGGATCGG GAGCGCCGAG CCGGGGGAGC GCAACGCGCT GGTGATGGCC 
GACGCGCTGC ACCGGGCGAC CGAGGCCAGC TACGCCGCTG TCGGGATCCC GGTCGAGGGC 
ACCATGCTCA CCGTCACCCG GGCCGCCTCC GAGGCCGCGA CCGAGATCGC CCGGGACCCC 
GGCTGCCGGG CCCGAGACGT GTTCACGGCC GCCGCGGCAG CCGCCCGCGA GGCCCTGGCG 
CACACCCCGG AGCAGCTGCC CGTGCTCCGC GAGGCGGGGG TCGTCGACGC CGGCGGGCGG 
GGCGTGAGCG TGATCCTCGA CGCGGCCGAG ACGGTGCTCA CGGGCCGCCG CCCGGTGCCG 
GTCACCGCGC CGTTCGGCAG CCATCACATC CCGATCCCCA CCGCGGCGAA GACCGGCGAC 
CTGACCCCGG ACGGACCCTC CTACGAGGTG ATGTACCTCC TGGACGCCGA CGACGCCGCG 
ATCCCGGGCC TGCGAACCGC GCTCGGCGGG CTCGGCGACT CCCTGGTCGT CGTCGGTGGC 
GAGGGCCTCT GGAACGTGCA CGTGCACGTC GACGACGTCG GCGCCGCGAT CGAGGCGGGC 
ATCGCCGCCG GCCGGCCGCA CCGGGTGCGG GTCACCCACT TCGCCGAGCA GATCGCCGCG 
GTCCGCGGCC GCACCGCCGC CCGCGACGGC CGCCGGGTCG TGGCCGTCGC GGCCGGGCCC 
GGGCTCGCCG CGCTGTTCGA GGAGGCGGGC GCGGTCGTCG TGCCCGGCGG CCCGGGGCGC 
CGACCCTCGA CGGGTCAGCT GCTCGAGGCG ATCACCGCAT GCGGCGCCTC CGAGGTCATC 
GTGCTGCCCA ACGACCACGA CTCGGTGCGG GTCGCGCAGA TCGCGGCGAG CACGGCCGAG 
GCTGACGCGG ACGGTGCGGT CCGGGTCGCG GTGATCCCGA CGCAGGCCCA GGTGACGGGC 
CTGGCGGCGG TCGCCGTCCA CGAGCCCGGT CGCTCGTTCG AGCAGGACGT GCTCGAGATG 
ACCGCCACCG CGCGCCACGC CCGTCAGGGG GCGGTCACGA TCGCGGCCAA GCAGGCGATG 
ACGATGGCCG GGCCCTGCGA GACCGGCGAC GCCCTGGGCG TGATCGCCGG CGACTTCGCC 
GTGGTGGGCA GCGACCTGTA CGCCGTCGCC GTCGAGGTGC TCGACCGCCT GCTCGGCGGT 
GGTGGCGAGC TCGTCACGAT CGTGGCGGGG GCCGAGGACG CCGAGGGCTC CCTCGCGACC 
CGGTGCGCGG GCTACGTCGA GGAGCACCAC CCCGCCGTCG ACGTCGTGGT GTACGACGGT 
GGCCAGGAGC GCTACCCGCT CCTCATGTCG GTGGAGTAG

Protein sequence

METPRSGAIT LEVVLRFVDI ATDALADARE EIDALNVYPV PDGDTGTNMY LTVSAARDAV 
REATGGDPAS DLGTALAAFS RGALLGARGN SGVILSEMLG AIARRIGSAE PGERNALVMA 
DALHRATEAS YAAVGIPVEG TMLTVTRAAS EAATEIARDP GCRARDVFTA AAAAAREALA 
HTPEQLPVLR EAGVVDAGGR GVSVILDAAE TVLTGRRPVP VTAPFGSHHI PIPTAAKTGD 
LTPDGPSYEV MYLLDADDAA IPGLRTALGG LGDSLVVVGG EGLWNVHVHV DDVGAAIEAG 
IAAGRPHRVR VTHFAEQIAA VRGRTAARDG RRVVAVAAGP GLAALFEEAG AVVVPGGPGR 
RPSTGQLLEA ITACGASEVI VLPNDHDSVR VAQIAASTAE ADADGAVRVA VIPTQAQVTG 
LAAVAVHEPG RSFEQDVLEM TATARHARQG AVTIAAKQAM TMAGPCETGD ALGVIAGDFA 
VVGSDLYAVA VEVLDRLLGG GGELVTIVAG AEDAEGSLAT RCAGYVEEHH PAVDVVVYDG 
GQERYPLLMS VE