Gene Cyan8802_2999 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cyan8802_2999
Symbol
ID	8392327
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8802
Kingdom	Bacteria
Replicon accession	NC_013161
Strand	+
Start bp	3032992
End bp	3034677
Gene Length	1686 bp
Protein Length	561 aa
Translation table	11
GC content	46%
IMG OID	644980946
Product	dihydroxy-acid dehydratase
Protein accession	YP_003138680
Protein GI	257060792
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism
COG ID	[COG0129] Dihydroxyacid dehydratase/phosphogluconate dehydratase
TIGRFAM ID	[TIGR00110] dihydroxy-acid dehydratase

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.398415
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAGATA ACCTTAGAAG TCGAATTGTT ACCCAAGGAA GTCAACGAAC CCCAAACCGG 
GCTATGCTCA GGGCTGTAGG GTTTGGAGAC AATGACTTTA TTAAACCAAT CGTTGGTGTA 
GCTAATGGAT ATAGTACCAT TACGCCCTGT AATATGGGAC TCAATGACCT AGCTTTGCGG 
GCCGAAGCGG GATTAAAAAG TGCCGGAGCC ATGCCACAAA TGTTTGGTAC CATTACCATT 
AGTGATGGTA TCTCCATGGG GACAGAAGGA ATGAAATATT CCCTTGTCTC ACGGGAAGTT 
ATCGCAGACT CCATCGAAAC CGCTTGTAAT GGTCAAAGTA TGGATGGAGT CATTGCCATT 
GGAGGGTGTG ATAAGAATAT GCCAGGGGCT ATGATTGCTA TAGCCCGAAT GAATATCCCT 
GCTATTTTCG TCTATGGGGG TACGATTAAA CCCGGCCATT ACCAGGGTGA AGATTTAACC 
GTTGTCAGTG CCTTTGAAGC CGTAGGAAAG TATAGCGCGG GTAAAATAGA TGATAACGAA 
TTATTAGCCA TTGAACGCAA TGCTTGTCCG GGTGCGGGGT CTTGTGGGGG AATGTTTACT 
GCTAACACCA TGTCATCCGC GTTTGAAGCG ATGGGGATGA GTTTACCCTA TTCTTCTACC 
ATGGCCGCAG AAGATGCTGA AAAAGCCGAT AGTACCGAAC AATCGGCCTT TGTTTTGGTT 
GAGGCTATCC GTAAACAGAT TTTACCTAGT CAGATTTTAA CCCGTAAAGC CTTTGAAAAT 
GCGATCGCGG TCATTATGGC TGTTGGAGGG TCAACCAATG CAGTATTACA CCTATTAGCC 
ATTGCTAATA CCATCGGGGT TGAGTTGAGT ATCGACGACT TTGAAACCAT TCGTAAAAAA 
GTTCCAGTTT TGTGTGATCT CAAACCATCG GGACGCTACG TTACCGTTAA TTTACATCAA 
GCGGGGGGCA TTCCCCAAGT GATGAAAATG CTGTTAAACC ATGGATTATT ACACGGGGAT 
GCGTTAACCA TTTCCGGACA AACTATTGCG GAAGTTTTGC AAGATATTCC CGATGAACCT 
CCCGCTAATC AAGATGTCAT TCGTCCTTGG AATAACCCGG TTTATCCAGA AGGACATTTA 
GCCATCCTCA AAGGGAATTT AGCCGCAGAA GGTGCGGTAG CTAAAATTAG TGGGGTCAAA 
AAACCTAAGA TGACCGGTCC AGCAAGGGTT TTTGAGTCAG AAGAAGCGTG TTTAGACGCA 
ATTTTAGCCG GAAAAATTAG CGCGGGAGAT GTCGTTATCG TTCGCTACGA AGGACCCAAA 
GGAGGCCCCG GAATGCGAGA AATGTTAGCC CCCACGTCTG CTATTATTGG CGCAGGATTA 
GGTGATTCAG TGGGATTAAT TACCGATGGA CGGTTCTCTG GAGGAACCTA CGGGTTAGTA 
GTTGGCCATG TCGCTCCTGA AGCCTTTGTT GGCGGTACAA TTGCCTTAGT TAACGAGGGA 
GATAGTATCA CCATTGATGC AGAAAAACGG CTATTGCAAT TAAATGTTTC TGACGAAGAA 
TTAACTACCC GTCGCGCTCA TTGGACTCCC CCTAAACCGC GCTATCAACG GGGAATTTTA 
GGGAAGTATG CTAAGTTAGT TTCTTCGAGT AGTTTAGGCG CAGTGACCGA TGTAGAGCTA 
TTCTAG

Protein sequence

MSDNLRSRIV TQGSQRTPNR AMLRAVGFGD NDFIKPIVGV ANGYSTITPC NMGLNDLALR 
AEAGLKSAGA MPQMFGTITI SDGISMGTEG MKYSLVSREV IADSIETACN GQSMDGVIAI 
GGCDKNMPGA MIAIARMNIP AIFVYGGTIK PGHYQGEDLT VVSAFEAVGK YSAGKIDDNE 
LLAIERNACP GAGSCGGMFT ANTMSSAFEA MGMSLPYSST MAAEDAEKAD STEQSAFVLV 
EAIRKQILPS QILTRKAFEN AIAVIMAVGG STNAVLHLLA IANTIGVELS IDDFETIRKK 
VPVLCDLKPS GRYVTVNLHQ AGGIPQVMKM LLNHGLLHGD ALTISGQTIA EVLQDIPDEP 
PANQDVIRPW NNPVYPEGHL AILKGNLAAE GAVAKISGVK KPKMTGPARV FESEEACLDA 
ILAGKISAGD VVIVRYEGPK GGPGMREMLA PTSAIIGAGL GDSVGLITDG RFSGGTYGLV 
VGHVAPEAFV GGTIALVNEG DSITIDAEKR LLQLNVSDEE LTTRRAHWTP PKPRYQRGIL 
GKYAKLVSSS SLGAVTDVEL F