Gene Ava_5010 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_5010
Symbol
ID	3679023
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	+
Start bp	6297095
End bp	6298132
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	40%
IMG OID	637720370
Product	aldo/keto reductase
Protein accession	YP_325502
Protein GI	75911206
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.250615
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.714816
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAATATA ACCAATTAGG CAATAGCGAT CTACAAGTTT CTGATATTTG CCTTGGCACA 
ATGACCTATG GGCAGCAAAA TACTATAGAA GAAGCCCATC AACAGCTAGA TTATGCAATT 
GCTCAAGGAG TTAATTTCAT CGATGCGGCT GAGATGTATC CAGTACCGAC CAGCGCTGAA 
ACATACGGAT TAACTGAGAC TTATATTGGA GAATGGTTAA AAAATCAACA GCGAGAGCAA 
CTAATAATTG CTACTAAAAT CGCGGGGCCT GGTCGTGGCT TTAAATGGGT ACGTGATGGA 
GCAAAAGCCA TTGACCGTAA TAATATCAAA CAAGCAGTGG ATGATAGTCT GCAAAGATTG 
CAGACAGATT ATATTGATTT ATATCAAATT CATTGGCCTG ATCGTTATGT ACCCCGTTTT 
GGACAAACAG TTTTCGATCC CACTCAGGTA GGGGAAACAA TTCCCATCAC TGAACAGCTG 
GAAGTTTTTG CTGATGTCAT CAATGCCGGA AAGATTCGCT ATATTGGCTT AAGTAATGAA 
ACTCCTTGGG GTGTAGCACA ATTTAGTCAT GCGGCTAAAC AATTGGGATT ACCTAAAGTT 
GTCTCCATTC AGAATGCTTA TAACTTGCTC AATCGAAATT TTGATGGCGC ACTTGCAGAA 
ACAGTTTATT ACGAAAATAT TCCTTTACTA GCTTATAGTC CTTTGGGATT CGGCTATTTA 
ACTGGTAAGT ATCTTAACGG TAAACCAGAG AAAGCAAGAG TTACTTTATT TGAAAACTTT 
GGTCAGAGAT ATTTAAAACC AAATGTTAGC AAAGCAGTAG CAGCTTATGT AGATATTGCC 
AAACGCCATC AACTGAGTCC TGCACAACTA GCGATCGCAT TCGTGCGGAG TCGTTGGTTT 
GTTGCTAGTA CGATTATTGG TGCGACTACA CTAGAACAAC TCAAAGAGAA TATAGAAAGC 
ATCAATGTAG TTCTTGATAA AGACATCTTG GCGCAATTGG ATGCAGTTCA CACTCAATAT 
CCAAATCCAG CACCATAA

Protein sequence

MQYNQLGNSD LQVSDICLGT MTYGQQNTIE EAHQQLDYAI AQGVNFIDAA EMYPVPTSAE 
TYGLTETYIG EWLKNQQREQ LIIATKIAGP GRGFKWVRDG AKAIDRNNIK QAVDDSLQRL 
QTDYIDLYQI HWPDRYVPRF GQTVFDPTQV GETIPITEQL EVFADVINAG KIRYIGLSNE 
TPWGVAQFSH AAKQLGLPKV VSIQNAYNLL NRNFDGALAE TVYYENIPLL AYSPLGFGYL 
TGKYLNGKPE KARVTLFENF GQRYLKPNVS KAVAAYVDIA KRHQLSPAQL AIAFVRSRWF 
VASTIIGATT LEQLKENIES INVVLDKDIL AQLDAVHTQY PNPAP