Gene Cyan7425_5219 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cyan7425_5219
Symbol
ID	7291174
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 7425
Kingdom	Bacteria
Replicon accession	NC_011884
Strand	+
Start bp	5321898
End bp	5322974
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	51%
IMG OID	643588177
Product	4-hydroxyphenylpyruvate dioxygenase
Protein accession	YP_002485873
Protein GI	220910562
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG3185] 4-hydroxyphenylpyruvate dioxygenase and related hemolysins
TIGRFAM ID	[TIGR01263] 4-hydroxyphenylpyruvate dioxygenase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.910123
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATATCG ATCACATTCA TTTCTATGTT GACAATGCCC AGCGATCGCG AAATTGGTGT 
GAGGAAATTC TTGGTTTTAC CCCGGTGGAA AGCCGCATCA GTCCCCACAG CCACACTGAA 
ATTTTAATTA ATGGCGGGAT TACGTTTGTT TTTTCTGCGC CCCTGACCGC GGCCAGTCCT 
GTCGCCCAGT TTTTACAATT CCAACCCCCT GGTGTGGCGG ATCTGGCCTT TCGGGTCAAT 
TCCCTGGCAG AAGTTCTGCA GCAAGCCACC CTGAACGGGG CTAAACAATT GCAACCCTTG 
CAAGCCCATA AGCAGGCAGG AGGAGAATTG AAATGGAGTC AAATCCAGGG CTGGGGAACC 
CTTAAACATA CACTGGTTGA ACGAACCGGG ATCACCTCTG TTTGGCCGGC CGAGGAGAGT 
GGTGGGGATC AGGGTCAGGA GCAGTGTCCG GGCAGGGCTG AGCATTCCCA CTTTAGCGGC 
ATTGACCACG CGGTTTTAAA CCTGGCGGAT CGGGATTTTG CGGCGGCGAT CGCCTGGTAT 
CAGCAAACCT TAGGCTTTCA GACTGATCGA GCATTTTCGA TTCAAACTCG GCGATCAGGT 
CTACGCAGTC AGGTGCTGAT CCATCCCCAG GGTACGGCCC AACTCCCACT TAATGCTCCA 
GTTTCAACCG GATCTCAAAT TCAGGAATTT TTAGAGCTGA ATCGGGGAGC AGGAATCCAA 
CATTTGGCAC TGCAAACCAG CGACATTACG ACCACGATCG CCCAATTGCG CCAACGGGGC 
CTGGCTTTTC TGGAAACCCC AGACTGTTAC TACAGCCATC TACAGGACCG CATAGCAAAA 
AGCAATTTAA ACCTGGAGAT TAGCCCACTC AAAGCACAGG GCATTCTGGT GGATTGGCAA 
TCAGAACAAC CCCACAGTTT ACTCTTACAA ATTTTTACGC AACCCATTTT CAATCAACCC 
ACTTTTTTCC TGGAAATCAT TGAACGGCGG CAGCAGGCCC AGGGTTTCGG GGAAGGTAAC 
TTTCTGGCCT TATTTGAGGC GATCGAGCGG GAACAGATGA AACGAGGGTC TTTATAG

Protein sequence

MNIDHIHFYV DNAQRSRNWC EEILGFTPVE SRISPHSHTE ILINGGITFV FSAPLTAASP 
VAQFLQFQPP GVADLAFRVN SLAEVLQQAT LNGAKQLQPL QAHKQAGGEL KWSQIQGWGT 
LKHTLVERTG ITSVWPAEES GGDQGQEQCP GRAEHSHFSG IDHAVLNLAD RDFAAAIAWY 
QQTLGFQTDR AFSIQTRRSG LRSQVLIHPQ GTAQLPLNAP VSTGSQIQEF LELNRGAGIQ 
HLALQTSDIT TTIAQLRQRG LAFLETPDCY YSHLQDRIAK SNLNLEISPL KAQGILVDWQ 
SEQPHSLLLQ IFTQPIFNQP TFFLEIIERR QQAQGFGEGN FLALFEAIER EQMKRGSL