Gene PCC8801_1649 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_1649
Symbol
ID	7101624
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	1723768
End bp	1724880
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	45%
IMG OID	643474720
Product	Rieske (2Fe-2S) domain protein
Protein accession	YP_002371856
Protein GI	218246485
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACTTGG CACAAAAGCC GGAGTTAGTG CGTCAACATC CCCATGAGGA GGAAGACTAC 
CCTATGAGTT CCCTTTTGCG TAACGCTTGG TACGTTGCTT TACCTGGAAA GCAGCTAAAA 
CCAGGGAAAA TGACCCATAA AAAGATGTTA GGAGAACCCG TCTTAGTGGG ACGACGGGAA 
GATGGGGAAG TCTTTGCTAT GCGCGATATT TGTCCCCATC GCGGTATCCC CCTACAGTAC 
GGATGGCTCG AAGGGGATGG GGTTTGTTGT TGCTATCATG GCTGGAAATT TAACACCAGC 
GATGGCCGGT GTAGTGAAAT TCCCTCCTTA ACCGAGTACG ATGACTTAGA TATTAGCCGT 
ATTCGTGTCC CTACCTACCC TTGTCGAGAA GTTCAAGGCA ATATTTGGGT CTATTTTGCT 
GAAGACTCCA AAAAAGAAAT TAACCCTTCA GAGCTTCCTC CCGTGCCAAC AATCCCCGAT 
TTTGGTAAAG TTGAGCCTGG AATCTCGGAA ACCATCCATT TTGCTTGCCA TATTGACCAT 
GCGATTATTG GCTTAATGGA CCCAGCCCAT GGCCCCTACG TTCATAGTTC CTGGTGGTGG 
CGCAGTGGTC CACGGAAGTT TCGAGTTAAA GAAAAGCAAT ATGAACCCGT AGCCCAAGGA 
TTTCGCCTCG TTCCTTATGA TATGCCAGTT AGTGCGCGAC CTTACAAGAT TTTAGGCAAT 
CAAGTGTCTA TTGAAATCGT TTTTGAGTTG CCCAGTGTAC GGACAGAGAT TTTAAGAGGC 
GATCGCTATT CGGCTTGCTT ATTGACTACC ATTACCCCCA TTGATGAAAA CGAATGCGAA 
GCCTTTCAAA GCATTTATTG GACAATTCCT TGGATGGGAC TATTTAAACC CCTATTAAGT 
TTGTTAACCC GTCAATTTCT GGCGCAAGAT CGAGATGTGG TTATTCAACA ACAAGAAGGG 
TTAAAATACA ATCCAGCCTT AATGCTAATT GATGACGCGG ATACTCAAGC TAAATGGTAT 
TTTCGCCTCA AACAGGAATA TCAAAAGTCC CAAGCAGAAA ATCGTCCCTT TAAAAATCCT 
GTAGAACCAA GGATTTTACG CTGGCGTAGC TGA

Protein sequence

MDLAQKPELV RQHPHEEEDY PMSSLLRNAW YVALPGKQLK PGKMTHKKML GEPVLVGRRE 
DGEVFAMRDI CPHRGIPLQY GWLEGDGVCC CYHGWKFNTS DGRCSEIPSL TEYDDLDISR 
IRVPTYPCRE VQGNIWVYFA EDSKKEINPS ELPPVPTIPD FGKVEPGISE TIHFACHIDH 
AIIGLMDPAH GPYVHSSWWW RSGPRKFRVK EKQYEPVAQG FRLVPYDMPV SARPYKILGN 
QVSIEIVFEL PSVRTEILRG DRYSACLLTT ITPIDENECE AFQSIYWTIP WMGLFKPLLS 
LLTRQFLAQD RDVVIQQQEG LKYNPALMLI DDADTQAKWY FRLKQEYQKS QAENRPFKNP 
VEPRILRWRS