Gene PCC8801_3121 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_3121
Symbol
ID	7105096
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	-
Start bp	3263154
End bp	3264839
Gene Length	1686 bp
Protein Length	561 aa
Translation table	11
GC content	46%
IMG OID	643476147
Product	dihydroxy-acid dehydratase
Protein accession	YP_002373258
Protein GI	218247887
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism
COG ID	[COG0129] Dihydroxyacid dehydratase/phosphogluconate dehydratase
TIGRFAM ID	[TIGR00110] dihydroxy-acid dehydratase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAGATA ACCTTAGAAG TCGAATTGTT ACCCAAGGAA GTCAACGAAC CCCAAACCGG 
GCTATGCTCA GGGCTGTAGG GTTTGGAGAC AATGACTTTA TTAAACCAAT CGTTGGTGTA 
GCTAATGGAT ATAGTACCAT TACGCCCTGT AATATGGGAC TCAATGACCT AGCTTTGCGG 
GCCGAAGCGG GATTAAAAAG TGCCGGAGCC ATGCCACAAA TGTTTGGTAC CATTACCATT 
AGTGATGGTA TCTCCATGGG GACAGAAGGA ATGAAATATT CCCTTGTCTC ACGGGAAGTT 
ATCGCAGACT CCATCGAAAC CGCTTGTAAT GGTCAAAGTA TGGATGGAGT CATTGCCATT 
GGAGGGTGTG ATAAGAATAT GCCAGGGGCT ATGATTGCTA TAGCCCGAAT GAATATCCCT 
GCTATTTTCG TCTATGGGGG TACGATTAAA CCCGGCCATT ACCAGGGTGA AGATTTAACC 
GTTGTCAGTG CCTTTGAAGC CGTAGGAAAG TATAGCGCGG GTAAAATAGA TGATAACGAA 
TTATTAGCCA TTGAACGCAA TGCTTGTCCG GGTGCGGGGT CTTGTGGGGG AATGTTTACT 
GCTAACACCA TGTCATCCGC GTTTGAAGCG ATGGGGATGA GTTTACCCTA TTCTTCTACC 
ATGGCCGCAG AAGATGCTGA AAAAGCCGAT AGTACCGAAC AATCGGCCTT TGTTTTGGTT 
GAGGCTATCC GTAAACAGAT TTTACCTAGT CAGATTTTAA CCCGTAAAGC CTTTGAAAAT 
GCGATCGCGG TCATTATGGC TGTCGGAGGG TCAACCAATG CAGTATTACA CCTATTAGCC 
ATTGCTAATA CCATGGGGGT TGAGTTGACT ATCGACGACT TTGAAACCAT TCGTAAAAAA 
GTTCCAGTTT TGTGTGATCT CAAACCATCG GGACGCTACG TTACCGTTAA TTTACATCAA 
GCAGGGGGCA TTCCCCAAGT GATGAAAATG CTGTTAAACC ATGGATTATT ACACGGGGAT 
GCGTTAACCA TTTCCGGACA AACTATCGCG GAAGTTTTGC AAGATATTCC CGATGAACCT 
CCCGCGAATC AAGATGTCAT TCGTCCTTGG AATAACCCGG TTTATCCAGA AGGACATTTA 
GCCATCCTCA AAGGGAATTT AGCCGCAGAA GGTGCGGTAG CTAAAATTAG TGGGGTCAAA 
AAACCTAAGA TGACCGGTCC AGCAAGGGTT TTTGAGTCAG AAGAAGCGTG TTTAGACGCA 
ATTTTAGCCG GAAAAATTAG CGCGGGAGAT GTCGTTATTG TTCGCTACGA AGGACCCAAA 
GGAGGCCCCG GAATGCGAGA AATGTTAGCC CCCACGTCTG CTATTATTGG CGCAGGATTA 
GGTGATTCAG TGGGATTAAT TACCGATGGA CGGTTCTCTG GAGGAACCTA CGGGTTAGTG 
GTTGGCCATG TCGCTCCTGA AGCCTTTGTT GGCGGTACAA TTGCCTTAGT TAACGAGGGA 
GATAGTGTCA CCATTGATGC AGAAAAACGG CTATTGCAAT TAAATGTTTC TGACGAAGAA 
TTAGCTACCC GTCGCGCTCA TTGGACTCCC CCTAAACCGC GCTATCAACG GGGAATTTTA 
GGGAAGTATG CTAAGTTAGT TTCTTCGAGT AGTTTAGGCG CAGTGACCGA TGTAGAGCTA 
TTCTAG

Protein sequence

MSDNLRSRIV TQGSQRTPNR AMLRAVGFGD NDFIKPIVGV ANGYSTITPC NMGLNDLALR 
AEAGLKSAGA MPQMFGTITI SDGISMGTEG MKYSLVSREV IADSIETACN GQSMDGVIAI 
GGCDKNMPGA MIAIARMNIP AIFVYGGTIK PGHYQGEDLT VVSAFEAVGK YSAGKIDDNE 
LLAIERNACP GAGSCGGMFT ANTMSSAFEA MGMSLPYSST MAAEDAEKAD STEQSAFVLV 
EAIRKQILPS QILTRKAFEN AIAVIMAVGG STNAVLHLLA IANTMGVELT IDDFETIRKK 
VPVLCDLKPS GRYVTVNLHQ AGGIPQVMKM LLNHGLLHGD ALTISGQTIA EVLQDIPDEP 
PANQDVIRPW NNPVYPEGHL AILKGNLAAE GAVAKISGVK KPKMTGPARV FESEEACLDA 
ILAGKISAGD VVIVRYEGPK GGPGMREMLA PTSAIIGAGL GDSVGLITDG RFSGGTYGLV 
VGHVAPEAFV GGTIALVNEG DSVTIDAEKR LLQLNVSDEE LATRRAHWTP PKPRYQRGIL 
GKYAKLVSSS SLGAVTDVEL F