Gene PCC8801_3897 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_3897
Symbol
ID	7103851
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	4087756
End bp	4088721
Gene Length	966 bp
Protein Length	321 aa
Translation table	11
GC content	32%
IMG OID	643476901
Product	2-keto-4-pentenoate hydratase-like protein
Protein accession	YP_002374002
Protein GI	218248631
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3971] 2-keto-4-pentenoate hydratase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGAAGA TAAACTATTT TTTGTTCCCC TTCTTCATTT TACTAAGTCC CCTTCCTGAA 
CTGGCACAAG TTAAAATAAA AGATCCATTA TTTAAGTCAA ATTATCATCA AATACACAAT 
ACAAATATTG CTGACTTTAA AGATGACTTT ATAACTTTAT CGAATCAAGA CTTAGATAAA 
TTAGCAGAAA AGTTAGCTAA TTATTATTTG ACTCAACAAA AAATTGATGA TTTTCCTGAC 
AATATAACTT CTAATCAGTC TCTTCTTATC CAATCTAAAT TTGTCAACAA TTTAATTAAT 
AATCAAGGCA ATATCATTGG TTATAAAGCA GGTTTGACTA ACCAAAAAAT CCAAGAAAGA 
TTTAACACAA ATCAACCTGT ATTAGGAACT TTACTCGAAA AAATGTTATT GCCATCAGGA 
ACAATCGTTT CCTCTAAATT TGGTGCTATT CCTATGATGG AAGGAGATTT AATGGTCAGA 
GTGAAAAGTG AGAAAATTAA TCAAGCAAAA ACGACCGAAG AAGTCTTAAA CTATTTAGAT 
GCTGTTATTC CATTTTTAGA ATTACCTGAT TTAATGTATA GCCAAGATCT AAAATTAAAT 
AAGGAAATGT TAGTCGCTAT TAATGTTGGT GCAAGATTAG GAATTATGGG AGAACCTATT 
CCGTTAGAAG CAACGAAAGA ATGGCACACT AAGTTAAGTA ATATTCAGGT TACTATTAAA 
GATGAATTGG GTCAAGAATT AGCCCAAGGA AACGGTAAAG CATTATTAGG AGATCCCTTA 
ACAGTTGTAC TCTGGATTAA AGATGAGCTA CGATCTCAAG GAAAAAGCCT AAAAAAAGGT 
GATTTGTTAT CTTTAGGAAG TATTACCCCT TTAATACCCG TTAAACCAGG AAAAACAATT 
TCAGCGCAGT ATTTAGGATT AAATGAAGCG AGCCCAGTTC AACTATCCGT CCACTTTGAA 
GAATAA

Protein sequence

MTKINYFLFP FFILLSPLPE LAQVKIKDPL FKSNYHQIHN TNIADFKDDF ITLSNQDLDK 
LAEKLANYYL TQQKIDDFPD NITSNQSLLI QSKFVNNLIN NQGNIIGYKA GLTNQKIQER 
FNTNQPVLGT LLEKMLLPSG TIVSSKFGAI PMMEGDLMVR VKSEKINQAK TTEEVLNYLD 
AVIPFLELPD LMYSQDLKLN KEMLVAINVG ARLGIMGEPI PLEATKEWHT KLSNIQVTIK 
DELGQELAQG NGKALLGDPL TVVLWIKDEL RSQGKSLKKG DLLSLGSITP LIPVKPGKTI 
SAQYLGLNEA SPVQLSVHFE E