Gene Snas_0287 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Snas_0287
Symbol
ID	8881466
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Stackebrandtia nassauensis DSM 44728
Kingdom	Bacteria
Replicon accession	NC_013947
Strand	+
Start bp	299266
End bp	300444
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	65%
IMG OID
Product	4-hydroxyphenylpyruvate dioxygenase
Protein accession	YP_003509098
Protein GI	291297820
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTGACA CGATCAACGA GGCCCAGCTC GTCGGAGCCG TCGAGCACGA CATCAACGCG 
GACGACTTCC CGATCAAGGG CTGGGACCAC ATCCGGTTCT ACGTGGGCAA CGCCAAACAG 
GCCGCGCACT ACTACTCCAC CGCCTTCGGC ATGACCCTGG AGGCATACCG CGGCCCCGAA 
CAGGGCTTCC GCGAGCACGC CGAGTACATG CTGCGCTCCG GCGGCGTCCG GTTCGTGCTG 
GCCGGTGGCA TCACCGCCGA CTCCGCCGCC ACCAAGCACT ACGCCGCCCA CGGCGACGGC 
GTCATCGAGG TGGCCCTCGA AGTGCCCAAC GTGGACGACA ACTACGCCTT CGCGATCAAG 
CAGGGCGCCG TGGGCGTCGA GGAACCGCAC GACCTCACCG ACGAGTACGG CACCGTCCGC 
GTCGCCGCCA TCGCCACCTA CGGCGAGACC CGGCACGTCC TGGTGGACCG GTCGCGCTAC 
AACGGCCCGT TCCTGCCCGG CTACGTCGCC GCCAAGCCCA TTGTGGACCG CACGGCGGCC 
ATCAAGGACG GCCGCGAACC CAAGCGCTTC TTCCAGGCCC TCGACCACGT CGTCGGCAAC 
GTCGAAGAGG GCAAGATGCT CGACTGGGTC ACCTTCTACC AGAAGGTGAT GGGCTTCACC 
AACATCGTCG AGTTCGTCGA CGACGACATC GCCACCGAGT ACTCGGCGCT GATGAGCAAG 
GTCGTGGCCA ACGGCACCCG CAAGGTGAAG TTCCCGATCA ACGAGCCCGC CGAGGGCCGC 
AAGAAGTCGC AGATCGACGA GTACCTGGAG TTCTACGGCG GCCCGGGCGT GCAGCACATG 
GCGCTGGCCA CCAACGACAT CCTGGCCAGT GTGGACGCCA TGCGCGCCAA CGGGGTCGAG 
TTCCTCGACG CGCCCGACTC CTATTACGAC GACCCTGAGA TGCGCGAACG CATCGGCACC 
GTCCGGGTCC CGATCGAGGA GCTCAAGAAA CGCTCCATTC TGGTCGACCG CGACGAGGAC 
GGCTATCTGT TGCAGATCTT CACCAAACCG CAGCAGGACC GACCCAGCGT CTTCTACGAA 
CTCATCGAGC GTCATGGATC GCTGAGTTTC GGAAAGGGCA ACTTCAAGGC CCTGTTCGAG 
GCCATCGAGA AAGAGCAAGC GAAACGCGGA AACCTTTAG

Protein sequence

MVDTINEAQL VGAVEHDINA DDFPIKGWDH IRFYVGNAKQ AAHYYSTAFG MTLEAYRGPE 
QGFREHAEYM LRSGGVRFVL AGGITADSAA TKHYAAHGDG VIEVALEVPN VDDNYAFAIK 
QGAVGVEEPH DLTDEYGTVR VAAIATYGET RHVLVDRSRY NGPFLPGYVA AKPIVDRTAA 
IKDGREPKRF FQALDHVVGN VEEGKMLDWV TFYQKVMGFT NIVEFVDDDI ATEYSALMSK 
VVANGTRKVK FPINEPAEGR KKSQIDEYLE FYGGPGVQHM ALATNDILAS VDAMRANGVE 
FLDAPDSYYD DPEMRERIGT VRVPIEELKK RSILVDRDED GYLLQIFTKP QQDRPSVFYE 
LIERHGSLSF GKGNFKALFE AIEKEQAKRG NL