Gene Noca_4680 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_4680
Symbol
ID	4598224
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	4964017
End bp	4965606
Gene Length	1590 bp
Protein Length	529 aa
Translation table	11
GC content	72%
IMG OID	639779289
Product	protein of unknown function DUF853, NPT hydrolase putative
Protein accession	YP_925862
Protein GI	119718897
COG category	[R] General function prediction only
COG ID	[COG0433] Predicted ATPase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0218814
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTGCGG ACATGACGTC GCCGATCGCC GAGCAGGTCG CCGCGGGCTA CCGCTTCGAG 
GGTCCGGCCC TCGAGCTCGG CGCCCTGATG CTCGCCGCCG ACCAGCTGGT CGACGTACCG 
GTCCGGATTC CGTTGGCGAT GCTGAACCGG CACGGCCTGG TGGCCGGGGC GACCGGCACC 
GGCAAGACCA GGACTCTTCA GCTGCTCGTC GAGCAGCTCA GCGCCCAGGG CGTCCCGGTC 
TTCGCCGCGG ACATCAAGGG CGACCTGTCC GGGCTGGCCC AGCCGGGCAC CGCGAGCGAG 
AAGCTCAGCG CCCGGGCCGC CACCGTCGGC CAGGAGTGGG CGGCCGCCGG CTTCCCCGTG 
GAGTTCTACG CGATCGGCGG CGTCGGGCCC GGGCTGCCGC TGCGGGTCAC CATGAGCGCG 
TTCGGGCCGA CCCTGCTGAG CAAGGTGCTG GGCCTCAACG ACACCCAGGA GTCCAGCCTG 
GGGCTGGTCT TCCACTACGC CGACCGGGCC GGCCTGCCGC TGCTCGACCT CGCCGACCTC 
CGCGCGGTGC TCGCGCACCT GCTCAGCGAC GAGGGCAAGG CCGAGCTCAA GGCGCTGGGT 
GGGCTGTCGT CGGCGACCGC CGGGGTGATC CTGCGCGAGC TGATCGGCCT GGAGGACCAG 
GGCGGCGACG TGTTCTTCGG CGAGCCGGAG TTCGAGTCGG CGGACCTGCT CCAGCTCGCC 
CCCGACGGCC GCGGCCTCGT CTCGCTGGTC GAGCTGCCGC AGCTGCAGGA CCGGCCGGCG 
ATCTTCTCGA CGTTCCTGAT GTGGCTGCTC GCCGACCTGT TCCACGACCT TCCCGAGGTC 
GGGGACGTGG ACAAGCCGAG GCTGGTGTTC TTCTTCGACG AGGCGCACCT GCTCTTCGCC 
GACGCGTCCA AGGCGTTCCT CGACCAGGTC GCCCAGACCG TGCGGCTGAT CCGGTCGAAG 
GGGGTCGGGG TGTTCTTCGT GACCCAGAGC CCCACCGACG TGCCCGACGC GGTGCTCGCC 
CAGCTCGGTT CGCGGATCCA GCACCAGCTG CGCGCGCACA CCCCCAACGA CGCCAAGGCG 
CTCAAGGCGA CCGTGGCGAC CTACCCGACC AGTGGGTACG ACGACCTCGG GCAGGTCATC 
ACCGGCCTCG GGATCGGCGA GGCCGTGGTG ACCGTGATGA ACGAGCGCGG TGCGCCGACG 
CCGGTGGCCT GGACCCGCCT GCGGGCGCCC CAGTCGCGGA TGGATCCGTG CGATCCCGAC 
GTCCTCACCG CCACCGTCGC GGCCAGCCCG CGGGCCGCGA AGTACCAGGC CGCGATCGAC 
CGGGAGTCCG CGCGCGAGAT CCTCGCCGAC CGGCTCGAGC AGGGTGCCGC GAAGCAGGAC 
CGCGAGCAGG CGGGCGCCCC CGGCCCGGAC CCTGATCCGG CGCCGCGCCC GGTGCCGGTC 
CCGAAGCCCA GCACCGACAA GCCCAGCAGC AGGCCCCCGA AGGACGACAG CGTGGTCGAG 
CAGGTCGTGA AGTCCGACGC GTTCAAGGAC TTCATGCGTA CCGCCGCCCG CGAGATCGCG 
CGGGGGATGT TCAAGACCGG CCGGCGCTGA

Protein sequence

MTADMTSPIA EQVAAGYRFE GPALELGALM LAADQLVDVP VRIPLAMLNR HGLVAGATGT 
GKTRTLQLLV EQLSAQGVPV FAADIKGDLS GLAQPGTASE KLSARAATVG QEWAAAGFPV 
EFYAIGGVGP GLPLRVTMSA FGPTLLSKVL GLNDTQESSL GLVFHYADRA GLPLLDLADL 
RAVLAHLLSD EGKAELKALG GLSSATAGVI LRELIGLEDQ GGDVFFGEPE FESADLLQLA 
PDGRGLVSLV ELPQLQDRPA IFSTFLMWLL ADLFHDLPEV GDVDKPRLVF FFDEAHLLFA 
DASKAFLDQV AQTVRLIRSK GVGVFFVTQS PTDVPDAVLA QLGSRIQHQL RAHTPNDAKA 
LKATVATYPT SGYDDLGQVI TGLGIGEAVV TVMNERGAPT PVAWTRLRAP QSRMDPCDPD 
VLTATVAASP RAAKYQAAID RESAREILAD RLEQGAAKQD REQAGAPGPD PDPAPRPVPV 
PKPSTDKPSS RPPKDDSVVE QVVKSDAFKD FMRTAAREIA RGMFKTGRR