Gene Ava_0023 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_0023
Symbol
ID	3678868
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	+
Start bp	20934
End bp	22625
Gene Length	1692 bp
Protein Length	563 aa
Translation table	11
GC content	46%
IMG OID	637715350
Product	dihydroxy-acid dehydratase
Protein accession	YP_320544
Protein GI	75906248
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism
COG ID	[COG0129] Dihydroxyacid dehydratase/phosphogluconate dehydratase
TIGRFAM ID	[TIGR00110] dihydroxy-acid dehydratase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.393007
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGGAGA ATCTTAGAAG CAAGGCTATC ACACAAGGGG TGCAGCGATC GCCTAACAGA 
GCAATGCTGC GGGCTGTTGG TTTTCAGGAT GCAGATTTTA CCAAAGCCAT TGTCGGTGTT 
GCCAATGGTT ACAGCACTAT TACCCCGTGT AATATGGGGA TAAATCAACT AGCACAAAGG 
GCAGAAGCTG GTATAAATCG CGCTGGAGCG AAGCCACAAA TATTCGGTAC AATTACGATT 
AGTGATGGGA TTTCGATGGG AACCGAAGGG ATGAAATATT CCCTGGTATC ACGAGAGGTA 
ATTGCTGACT CCATTGAAAC CGTTTGTAAT GGGCAAAGTT TAGATGGGGT AATTGCCATT 
GGTGGCTGTG ATAAAAATAT GCCAGGGGCA ATGATAGCGA TCGCTCGGAT GAACATCCCT 
GCTATCTTTG TTTACGGTGG CACAATTAAA CCCGGACACT ACAACGGCAA AGATTTAACT 
GTTGTTAGTT CTTTTGAAGC TGTCGGTGAG TACAGCGCTG GCAAAATCGA CGAAAATGAA 
CTGTTAGCAG TAGAACGCAA TGCTTGTCCT GGTGCAGGTT CCTGCGGTGG GATGTACACA 
GCAAATACTA TGTCCTCTGC TTTTGAAGCA CTGGGAATGA GTTTGCCCTA TTCGTCTACA 
ATGGCAGCAG AAGACGACGA AAAAGCTGAT AGTACGGAAG AATCAGCCAA GGTATTAGTA 
GAAGCAATTC GTCATCAGCT ATTACCCAGG CAGATTATCA CTCGTAAATC CATAGAGAAT 
GCCATAGCAG TAATTATGGC GGTGGGAGGT TCCACCAATG CCGTGTTACA TTTTCTAGCG 
ATCGCCCGTG CAGCTGGTGT AGAGTTAAAT CTAGACGACT TTGAAACTAT TCGTGGTCGT 
GTCCCCGTTT TGTGCGACTT GAAACCAAGC GGTAGATATG TAGCTACAGA CCTGCACAAA 
GCTGGTGGTA TACCCCAAGT CATGAAAATG TTACTTGTGC ATGGTTTACT CCACGGCGAC 
TGTATAACCA TCACAGGTAA AACCATTGCC GAAGTTTTAG CAGATATCCC AGAAGAACCA 
TCGCCTAATC AAGACGTGAT TCGTCCTTGG AATAAACCCA TGTATGCCCA AGGTCACTTG 
GCTATACTCA AAGGTAATTT GGCTACAGAA GGCGCAGTCG CCAAAATTAC AGGTGTGAAA 
AATCCTGTGA TTACCGGGCC AGCCAAAGTA TTTGAATCAG AAGAAGATTG TTTAGATGCA 
ATTTTGGCAG GTAAGATTAA AGCCGGAGAC GTGATTGTCG TCCGTTACGA AGGCCCCAAA 
GGCGGCCCTG GGATGCGAGA AATGTTAGCC CCCACCTCAG CTATTATCGG TGCAGGTTTA 
GGTGATTCAG TGGGATTAAT TACCGATGGA CGCTTCTCCG GTGGTACTTA TGGGATGGTA 
GTCGGACACG TTGCACCAGA AGCAGCCGTT GGTGGAGCGA TCGCACTGGT ACAAGAAGGT 
GATAGCATCA CAATTGATGC CCATACCCGT TCTTTGCAGT TGAACATATC AGACGAAGAA 
TTAGCCCATC GTCGTGCCAA CTGGCAACCC CGTCCCCCAC GTTACACTAA AGGCATACTC 
GCAAAATACG CCAAGTTAGT AGCTTCTAGT AGTGTAGGTG CGGTCACCGA TTTAGACTTA 
TTTAATGAAT AG

Protein sequence

MSENLRSKAI TQGVQRSPNR AMLRAVGFQD ADFTKAIVGV ANGYSTITPC NMGINQLAQR 
AEAGINRAGA KPQIFGTITI SDGISMGTEG MKYSLVSREV IADSIETVCN GQSLDGVIAI 
GGCDKNMPGA MIAIARMNIP AIFVYGGTIK PGHYNGKDLT VVSSFEAVGE YSAGKIDENE 
LLAVERNACP GAGSCGGMYT ANTMSSAFEA LGMSLPYSST MAAEDDEKAD STEESAKVLV 
EAIRHQLLPR QIITRKSIEN AIAVIMAVGG STNAVLHFLA IARAAGVELN LDDFETIRGR 
VPVLCDLKPS GRYVATDLHK AGGIPQVMKM LLVHGLLHGD CITITGKTIA EVLADIPEEP 
SPNQDVIRPW NKPMYAQGHL AILKGNLATE GAVAKITGVK NPVITGPAKV FESEEDCLDA 
ILAGKIKAGD VIVVRYEGPK GGPGMREMLA PTSAIIGAGL GDSVGLITDG RFSGGTYGMV 
VGHVAPEAAV GGAIALVQEG DSITIDAHTR SLQLNISDEE LAHRRANWQP RPPRYTKGIL 
AKYAKLVASS SVGAVTDLDL FNE