Gene Noca_2449 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_2449
Symbol
ID	4599790
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	2611176
End bp	2612456
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	71%
IMG OID	639777051
Product	3,4-dihydroxy-2-butanone 4-phosphate synthase / GTP cyclohydrolase II
Protein accession	YP_923640
Protein GI	119716675
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0108] 3,4-dihydroxy-2-butanone 4-phosphate synthase [COG0807] GTP cyclohydrolase II
TIGRFAM ID	[TIGR00505] GTP cyclohydrolase II [TIGR00506] 3,4-dihydroxy-2-butanone 4-phosphate synthase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCACCG AGATCAGGCT CGACACCGTC GAGCGGGCGA TCGCCGACAT CGCCGCCGGC 
AAGGCCGTGG TCGTCGTCGA CGACGAGGAC CGCGAGAACG AGGGCGACAT CATCTTCGCC 
GCCAGCAAGG CGACCCCCGA CCTGATGGCC TTCACGATCC GCTACAGCAG CGGCGTGATC 
TGCGTGCCGA TGCCGGCCCG GATGCTCGAC CGGCTCGAGA TCCCGCTGAT GACGCCGCAC 
AACAAGGACC GGCTGCGTAC GGCGTACACG ATCTCGGTCG ATGCCCGCGA CGGGGTGACC 
ACGGGCATCT CCGCCGCCGA CCGGGCGCAC ACCGTCCGGG TGCTCGCCGA CTCGGCGACC 
GAGCCGTGGG AGATCACCCG CCCCGGTCAC GTCTTCCCAC TGCGCTACCG CGAGGGCGGC 
GTGCTGGTGC GCCGCGGACA CACCGAGGCC GCGGTCGACC TCGCGAAGCT GGCCGGGTTG 
ACCCCCGCGG GCGTGCTGGT CGAGGTCGTC AACGACGACG GGACCATGAA GCGCGGGCCC 
GAGCTGCGCG CCTTCGCCGA CGAGCACGGC CTGGCGATGA TCTCGATCGA CGACCTGGTG 
CGCTACCGGC GGCGCCACGA GACCCTCGTC GAGCGGGTCG CCGAGACCCA GCTGCCGACC 
CGGCACGGTG ACTTCACGGC GTACGGCTAC CGGATCACCG TCGACGGCTC CGAGCACATC 
GCGCTCGTCC ACGGCGACAT CAGCGGACCG GAGCCCGTGC TCACCCGGGT GCACTCGGAG 
TGCCTGACCG GCGACGTGTT CGGCAGCCAC CGCTGCGACT GCGGGCCACA ACTGGAGGAG 
GCCCTCGAGC GGATCGTGGC CGAGGGGCGC GGCGTGGTCG TCTACCTGCG CGGCCACGAG 
GGCCGCGGGA TCGGGCTGGT CGCGAAGCTG CAGGCCTACC AGCTCCAGGA CGGCGGCCGG 
GACACCGTCG ACGCGAACCT CGACCTCGGC CTGCCGGCCG ACGCCCGCCA CTACGGCACG 
GCCACCCAGG TGCTGCGCGA CCTCGGCGTC GGCAGCGTCC GGCTGATGAC CAACAACCCG 
GACAAGGTGC GCAACCTCGA GGACTACGGT GTGTCGGTCG CCGCCCGGGT GCCGCTGACG 
CCGCACCCCA ACGACCACAA CATCGCCTAC CTGCTCACCA AGCGCGACCG AATGGGTCAC 
GATCTGCCCA ACCTTGCCGA TGGGGTGCCC GACACCCGTG CCGACGGGGT GCCCGACACC 
CTTGCCCAGA ACGGAGCCTG A

Protein sequence

MSTEIRLDTV ERAIADIAAG KAVVVVDDED RENEGDIIFA ASKATPDLMA FTIRYSSGVI 
CVPMPARMLD RLEIPLMTPH NKDRLRTAYT ISVDARDGVT TGISAADRAH TVRVLADSAT 
EPWEITRPGH VFPLRYREGG VLVRRGHTEA AVDLAKLAGL TPAGVLVEVV NDDGTMKRGP 
ELRAFADEHG LAMISIDDLV RYRRRHETLV ERVAETQLPT RHGDFTAYGY RITVDGSEHI 
ALVHGDISGP EPVLTRVHSE CLTGDVFGSH RCDCGPQLEE ALERIVAEGR GVVVYLRGHE 
GRGIGLVAKL QAYQLQDGGR DTVDANLDLG LPADARHYGT ATQVLRDLGV GSVRLMTNNP 
DKVRNLEDYG VSVAARVPLT PHPNDHNIAY LLTKRDRMGH DLPNLADGVP DTRADGVPDT 
LAQNGA