Gene Ava_4500 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_4500
Symbol
ID	3680201
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	+
Start bp	5636180
End bp	5637358
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	45%
IMG OID	637719856
Product	zinc-containing alcohol dehydrogenase superfamily protein
Protein accession	YP_324993
Protein GI	75910697
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.658078
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.320847
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGCAG TTTGCTGGCA CGGGACAAAT GATGTCAGGG TAGAAACTGT ACCCGATCCA 
AAAATTCTTA ACCCGCGCGA CGCAATTATT AAAATTACAT CTACCGCTAT TTGTGGGTCT 
GATTTACATA TATATAATGG CTATATTCCC ACAATGCAAA GTGGCGATAT CCTTGGTCAT 
GAATTTATGG GGGAAGTTGT CGAGTTAGGT AGTGCTGTAA AAAATGTGAA AGTAGGCGAT 
CGCGTGGTTG TCCCTTTCAC TATTTCCTGC GGTTCTTGCT TCTTCTGTCA ACGGGATTTA 
TGGTCTTTGT GCGATAACTC CAACCCCAAC GCCTGGATGG TAGAACTGCA AATGGGGCAT 
TCTCCAGCAG GTTTATTCGG CTACTCTCAT CTATTTGGCG GCTATGCTGG TGGTCAAGCA 
GAATACGCCC GTGTACCTTT TGCAGATGTC GGTTTACTCA AAATCCCCGA TAATCTACCA 
GATGAACAAG TATTATTTTT AACTGACATT TTTCCTACCG GCTATATGGC AGCGGAAAAC 
TGCAACATCA AACCAGGCGA TATTGTGGCT GTGTGGGGTT GTGGCCCCGT CGGGCAATTT 
GCTATCAAGA GTGCATATAT GTTGGGTGCG GAAAGAGTTA TCGCCTTTGA CCGCATCCCT 
GAACGCCTAC AAATGGCTAA AGAACAATGT AATGCGGAAG TCCTCAATTA CGAAGAGGTA 
AACATTGGGG AAGCACTGAA AGAAATGACT GGTGGACGCG GCCCTGATGC TTGTATAGAT 
GCGGTGGGAA TGGAAGCCCA CGGTACAGAT TTGATGGCTT TCTACGACCA AGTAAAGCAA 
GCTGTAAGGC TAGAAACAGA CAGACCAACA GCATTACGAC AAGTCATTGT GTCTGCGGCT 
AAAGGCGGTC ATGTTTCCCT GGCTGGTGTA TATGGCGGCT TTCTAGACAA AATCCCGATG 
GGTTCAGCAA TGAATAAGGG CTTAACTTTC AAGATGGGAC AAACTCATGT GCATAAATAC 
TTGAGGCCTT TACTAGAACG CATTCAAAAC GGTGAAATTG ACACCTCATT TGTCATCACC 
CACACCCTCC CCCTAGAACA AGCACCCCAC GGTTACGAAA TTTTTAAGCA CAAAAAAGAT 
AACTGCATCA AAGTTGTACT CAAACCCTCA GGTAATTAA

Protein sequence

MKAVCWHGTN DVRVETVPDP KILNPRDAII KITSTAICGS DLHIYNGYIP TMQSGDILGH 
EFMGEVVELG SAVKNVKVGD RVVVPFTISC GSCFFCQRDL WSLCDNSNPN AWMVELQMGH 
SPAGLFGYSH LFGGYAGGQA EYARVPFADV GLLKIPDNLP DEQVLFLTDI FPTGYMAAEN 
CNIKPGDIVA VWGCGPVGQF AIKSAYMLGA ERVIAFDRIP ERLQMAKEQC NAEVLNYEEV 
NIGEALKEMT GGRGPDACID AVGMEAHGTD LMAFYDQVKQ AVRLETDRPT ALRQVIVSAA 
KGGHVSLAGV YGGFLDKIPM GSAMNKGLTF KMGQTHVHKY LRPLLERIQN GEIDTSFVIT 
HTLPLEQAPH GYEIFKHKKD NCIKVVLKPS GN