Gene Noca_1295 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_1295
Symbol
ID	4598917
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	1368677
End bp	1369870
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	68%
IMG OID	639775889
Product	4-hydroxyphenylpyruvate dioxygenase
Protein accession	YP_922496
Protein GI	119715531
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG3185] 4-hydroxyphenylpyruvate dioxygenase and related hemolysins
TIGRFAM ID	[TIGR01263] 4-hydroxyphenylpyruvate dioxygenase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.498463
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACACTGA CACCGGACGA GCTCAAGGCC GACCTGACCC TCGACCAGCT CAAGGAGCTG 
GTCGGCCTCG TGGAGTACGA CGCCGCCAAC GACCCCTTCC CGGTGATCGC CCAGGACGCC 
GTCTGCTTCG TGGTCGGCAA CGCCACCCAG ACCGCGTCCT TCTACCAGCT CGCGCTCGGG 
ATGGAGCTCG AGGCCTACCG TGGCCCGGAG AACGGGTGTC GCGAGTCCAA GTCCTACGTG 
CTGCGCTCGG GCAGCGCCCG GTTCGTCTTC ACCGGCGGGG TCACCCCGGA CAGCCCGGTG 
CTCGACCACC ACCGCAGGCA CGGCGACGGG GTCGTCGACC TGGCGATGGA GGTGCCCGAC 
GTCGACCGGT GCATCGAGCA CGCCCGGGCG ATGGGCGCCA CGATCCTGGT GGAGCCCCAC 
GACGAGACCG ACGAGCACGG CACGGCCCGG CTCGCCGCGA TCGCGACGTA CGGCGAGACC 
CGCCACACCC TGGTCGACCG CTCGCGCTAC TCCGGCCCCT ACCTGCCCGG CTACGCGCCG 
GCCACGACCA CGGTGACCCG CCGCGAGGGC CGGCCCAAGC GCCTGTTCCA GGCGATCGAC 
CACTGCGTCG GGAACGTCGA GCTCGGCCGC ATGGACGAGT GGGTGACGTT CTACAACAGG 
GTGCTCGGCT TCACGAACAT GGCCGAGTTC ATCGGCGACG ACATCGCGAC CGACTACTCC 
GCGCTGATGT CCAAGGTCGT CGCGAGCGGC AACCACCGGG TGAAGTTCCC GCTCAACGAG 
CCCGCCGTGG CGAAGAAGAA GTCCCAGATC GACGAGTACC TCGAGTTCTA CGACGGTGCC 
GGCTGCCAGC ACATCGCGCT GGCGACCAAC GACATCCTGC GCAGCGTCGA CGTCCTGCGC 
GAGAACGGCA TCCAGTTCCT CGACACCCCG GACTCCTACT ACGACGACCC CGAGCTGCGC 
GCCCGGATCG GCGAGGTGCG GGTGCCGATC GAGGAGCTGA AGAAGCGCAA GATCCTCGTC 
GACCGCGACG AGGACGGCTA CCTGCTGCAG ATCTTCACCA AGCCGATGGG GGACCGGCCG 
ACGGTCTTCT ACGAGTTCAT CGAACGGCAC GGCTCGCTCG GCTTCGGCAA GGGCAACTTC 
AAGGCGCTGT TCGAGGCGAT CGAGCGCGAG CAGGAGCTCC GCGGCAACCT CTGA

Protein sequence

MTLTPDELKA DLTLDQLKEL VGLVEYDAAN DPFPVIAQDA VCFVVGNATQ TASFYQLALG 
MELEAYRGPE NGCRESKSYV LRSGSARFVF TGGVTPDSPV LDHHRRHGDG VVDLAMEVPD 
VDRCIEHARA MGATILVEPH DETDEHGTAR LAAIATYGET RHTLVDRSRY SGPYLPGYAP 
ATTTVTRREG RPKRLFQAID HCVGNVELGR MDEWVTFYNR VLGFTNMAEF IGDDIATDYS 
ALMSKVVASG NHRVKFPLNE PAVAKKKSQI DEYLEFYDGA GCQHIALATN DILRSVDVLR 
ENGIQFLDTP DSYYDDPELR ARIGEVRVPI EELKKRKILV DRDEDGYLLQ IFTKPMGDRP 
TVFYEFIERH GSLGFGKGNF KALFEAIERE QELRGNL