Gene PCC8801_1103 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_1103
Symbol
ID	7102267
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	-
Start bp	1162392
End bp	1163480
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	36%
IMG OID	643474194
Product	Rieske (2Fe-2S) domain protein
Protein accession	YP_002371332
Protein GI	218245961
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGGACT CAGATAGGAA TGCTACCCAA GGGAGAGATA TTCGTACCTG TGGAATCAAT 
CCTAACCATT GGTATGTGGT AGCTGGTAGT ACAGAAATTA AGGATCGTCC TTTGGGGGTG 
ACGATCTGGG ATCACTCTAT TGTACTTTAT CGGGATACCT TGGGAAAGAT TCATGCCCTA 
GAAAATCGCT GTCCCCATCG TCAAGTCAAA CTCAGTGACG GGAAAGTTAT CGGTAATCAT 
CTAGAATGTG CTTATCATGG ATGGCAATTT AATTCCCAAG GAACTTGTCA CTCAATTCCC 
TATTTAAACG AAAAACAAAA GTTACCTAAG TGTCAAATTA ATTCCTATCC TGTTGAAGAA 
TTAAATGGAT TTATTTGGTT GTTTTTGGGA GACCCGCAAA GATTGGAGAA TAATGATATA 
TTACCCCTAG CTATACCTGA ATGGGATCAT CTTAATTATA TTGCTACTGT TTCGGTCATT 
GAATGTCGTG GACATTTTTC TTTTGTGATT GAAAATTTGA TGGATATGTA CCACGGGCAT 
TTACATCAGA ACTATCAAGC TTGGACAGAT GCTAACTTAA AAGAACTCTC TGGCAATGAG 
CAACGAGTAG AGGCAATTTA TGAAGCCAAA AGCTATTATA AAATAGATAA AATTTGGTCG 
ATTTGTCAAT TATTTTTTTC TCCGTTACGT CGCCTTCATT CGGAACTCTT AAAAGTAAGT 
TATATTTATC CCCATTGGGT GTCAACTTTA GGAGAAGATT TTAAAATTTA TTGCTTATTT 
TGTCCTGTCA ATCGAACTTA TACTAAGGCT TATTTAATTC ATTTTACTTC ATTAAATGCT 
TTTGTGAGAT TGCATAAATT ACCGATTTGG TTTCGACAGT TTATTAAAGA TTCCCTATTT 
GGTTCAGCCC AAAAAATGTT AGATGGTTTA GTCAAACAAG ATGTTATGAT GATCGAACAA 
GAACAAGAAG CTTATTTACA AGATAAACAA CGACGAACCC ATGAAGTTAA CCCCACCATT 
GGACAAGTTC AAAAATTAAT TAAACAGCAA TTAACTTTGA GTTCGGAGGT TAACATTATG 
ATTGAGTAG

Protein sequence

MMDSDRNATQ GRDIRTCGIN PNHWYVVAGS TEIKDRPLGV TIWDHSIVLY RDTLGKIHAL 
ENRCPHRQVK LSDGKVIGNH LECAYHGWQF NSQGTCHSIP YLNEKQKLPK CQINSYPVEE 
LNGFIWLFLG DPQRLENNDI LPLAIPEWDH LNYIATVSVI ECRGHFSFVI ENLMDMYHGH 
LHQNYQAWTD ANLKELSGNE QRVEAIYEAK SYYKIDKIWS ICQLFFSPLR RLHSELLKVS 
YIYPHWVSTL GEDFKIYCLF CPVNRTYTKA YLIHFTSLNA FVRLHKLPIW FRQFIKDSLF 
GSAQKMLDGL VKQDVMMIEQ EQEAYLQDKQ RRTHEVNPTI GQVQKLIKQQ LTLSSEVNIM 
IE