Gene Namu_4151 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4151
Symbol
ID	8449777
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	4585831
End bp	4587282
Gene Length	1452 bp
Protein Length	483 aa
Translation table	11
GC content	73%
IMG OID	645043200
Product	3,4-dihydroxy-2-butanone 4-phosphate synthase
Protein accession	YP_003203429
Protein GI	258654273
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0108] 3,4-dihydroxy-2-butanone 4-phosphate synthase
TIGRFAM ID	[TIGR00505] GTP cyclohydrolase II [TIGR00506] 3,4-dihydroxy-2-butanone 4-phosphate synthase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.0115594
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.00443199
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACCAGCA CGGCGCCCGG AGCGCAGAAC CAGGACCTGG GCTTCGCCGG GATCCCCGCG 
GCCGACTTCA CCGAGGCGCC CCGGCGGCCC CGGGCCGACC GCGGCCCGGC CGGCGACGCG 
GCCGTCGACA CGGGGTACGC CGGGATCCCG TTCGAGGACG GCACCGCGGC GCCGCCCCGG 
CCCTGGGACC CGAACCGGCC CAAGACCGAG GCCGGCTTCG ACACCATCGA TTTCGCCCTG 
GCCGAGCTGG CCGCCGGCCG CGCGGTCGTC GTTGTCGACG ACGAGGACCG GGAGAACGAG 
GGTGACCTGA TCTTCGCCGC CGAGCTGGCC ACCCCCGAGC TGATGGCCTT CACGGTGCGC 
CACTCCTCGG GCGTGGTCTG CGTCGGTCTG ACCGGAGACG CCTGCGACCG GCTCGACCTG 
CCGCCGATGT ACCACCGCAA CCAGGACCGC AAGTCGACCG CGTTCACCGT CAGCGTCGAC 
GCCAAAGAGG GCGTCACCAC CGGCATCTCG GCGGCGGAAC GGGCGCACAC GGTGCGCCTG 
CTGGCCGACC CGGCGGCCAC CGACGAGGAC CTGTCGCGGC CCGGCCACGT CTTCCCGCTG 
CGCGCCCGCG ACGGCGGCGT GCTGGTCCGC CCCGGGCACA CCGAGGCCGC CGTCGACCTG 
GCCGCCCTGG CCGGGCTGCA GCCGGCCGGT GCCCTGTGCG AGATCGTCAA CCACGACGGC 
TCGATGTCCC GGCTGCCCGA CCTGCAGGTC TTCGCCCGCC GGCACCGGCT CGCGCTGATC 
TCCATCGCCG ACCTGATCGC CTACAAGCGG GCCCGCGAGG TGCAGATCCG CAAGGTCGCC 
AGCGCCCGGC TGCCGCTGCC GCAGGGCGTG TTCACGGCCG TCGGCTACAT CAGCACGGTC 
ACCGGCCGGG AGCTGATCGC ATTGGTGGCC GGCGAGATCG GCGACGGCCG GGACGTGCTG 
GTGCGCGTGC ACTCGGAGTG CCTGACCGGT GATGTGCTCG GATCGCTGCG CTGCGACTGC 
GGTCCGCAGC TGCAGGCCGC GCTGCAGGCG GTCGCCGACG AGGGGCGCGG CGTGGTGCTC 
TACATCCGTG GGCACGAGGG CCGGGGGATC GGTCTGCTGG ACAAGCTGCG GGCCTACGAG 
CTGCAGGACG CCGGGGCGGA CACGGTCGAT GCGAACCTGC AGCTGGGCCT GCCGTCCGAC 
TCGCGCGAGT ACGGCACCGG CGCCCAGGTG CTGGCCGATC TGGGCATCAC CTCGATGCGG 
CTGCTGACCA ACAACCCGGC CAAGCGGGCC GGGCTGGAGG GCTACGGCCT GTCGATCAAC 
GGCCGGGTGT CGTTGCCGGC CCACGTCAAC CCCGAGAACC TGCGGTACCT GACCACCAAG 
CGGGACCGGA TGGGGCACGA GTTGGACGGG CTGGACGGGA CGGACATCCT GTACGGCGAG 
GGACACGCGT GA

Protein sequence

MTSTAPGAQN QDLGFAGIPA ADFTEAPRRP RADRGPAGDA AVDTGYAGIP FEDGTAAPPR 
PWDPNRPKTE AGFDTIDFAL AELAAGRAVV VVDDEDRENE GDLIFAAELA TPELMAFTVR 
HSSGVVCVGL TGDACDRLDL PPMYHRNQDR KSTAFTVSVD AKEGVTTGIS AAERAHTVRL 
LADPAATDED LSRPGHVFPL RARDGGVLVR PGHTEAAVDL AALAGLQPAG ALCEIVNHDG 
SMSRLPDLQV FARRHRLALI SIADLIAYKR AREVQIRKVA SARLPLPQGV FTAVGYISTV 
TGRELIALVA GEIGDGRDVL VRVHSECLTG DVLGSLRCDC GPQLQAALQA VADEGRGVVL 
YIRGHEGRGI GLLDKLRAYE LQDAGADTVD ANLQLGLPSD SREYGTGAQV LADLGITSMR 
LLTNNPAKRA GLEGYGLSIN GRVSLPAHVN PENLRYLTTK RDRMGHELDG LDGTDILYGE 
GHA