Gene Ava_0798 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_0798
Symbol
ID	3680738
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	+
Start bp	979441
End bp	980568
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	47%
IMG OID	637716127
Product	semialdehyde dehydrogenase, NAD - binding
Protein accession	YP_321317
Protein GI	75907021
COG category	[R] General function prediction only
COG ID	[COG0673] Predicted dehydrogenases and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	44
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.577459
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTAAAA TCGCTGTTAT CGGGGTAGGA CGCTGGGGAG TACATTTGTT GCGGAATTTT 
TTAGCACATC CGCAAGCGGA GGTCGTGGCA ATAGTTGACC CCCATCCAGA AAGGTTAACG 
GTAGTCAAGC AGCAGTTTAA TTTGGCTGAA AGTGTCCTGT TAACCACCCA GTGGTCTGAC 
TTACAAACAG TGCCAGAATT AACAGCAGTA GCGATCGCTA CTCCAGCTAC CACTCACTAC 
GCTTTAATTA AAGATGCTCT GGCTCAAGGC TATCATGTTC TGGCAGAAAA ACCCCTAACC 
TTAGACCCTA CAGAATGCCA AGAACTTTGC CAATTGGCAG AGCGACGGCA ATTAATACTC 
ATGGTGGATC ATACCTATTT ATTTCACCCA GCCGTTGAGG AAGGTCAAAC TGTCATTCAG 
GCTGGTAAAT TAGGTGAGTT ACGTTACGGC TATGCTACAC GCACCCATTT AGGCCCTGTC 
CGTCAAGATG TTGATGCCTT ATGGGATTTA GCCATCCATG ATATCGCCAT CTTTAACAAC 
TGGTTAGGTA AAGCACCTGT AAGTGTACAG GCGACGGGTA CAGTTTGGCT GCAAGGTGAG 
GGGAAAGAGG CAGGGGGCAG GGGGCAGGGG GCAGGGGAGG CAGGGGGAGA ACTGACTGCA 
AGATTTTCGC CCCAGTCCCC AATCCCCAAT CCTCAATCCC CAGTCCCCAG TCCTCAGTCC 
CCAGAATTAG CCGATTTAGT TTGGGTAACG TTAACTTATC CAGATGGTTT TAAGGCGTAT 
ATTCACCTGT GCTGGTTGAA TAATGATAAA CAGCGCCGTC TGGCGGTGGT AGGAAGCCTT 
GGCACTTTAA TTTTTGATGA AATGTCACCA TCATCACAAT TGACTTTATT GCATGGTGAA 
TTTGAACGTC AGGGAAATCT ATTTTTGCCT GTAAATCAAA GCCGAGAAGT ATTAGAACTC 
AAAGCCGGCG AACCTTTACA ACGAGTTTGC GATCGCTTTA TTACTTCTGT TCTCCAGAAT 
ACACCCCCAA GCATTTCTTC TGGTTGGGTA GGTACAGAGT TAGTCAAAAT TCTCTCTGCT 
CTAACTACAT CTCTCCAACA AAGCGGCCAA TCTGTTTCTC TTCAATAA

Protein sequence

MTKIAVIGVG RWGVHLLRNF LAHPQAEVVA IVDPHPERLT VVKQQFNLAE SVLLTTQWSD 
LQTVPELTAV AIATPATTHY ALIKDALAQG YHVLAEKPLT LDPTECQELC QLAERRQLIL 
MVDHTYLFHP AVEEGQTVIQ AGKLGELRYG YATRTHLGPV RQDVDALWDL AIHDIAIFNN 
WLGKAPVSVQ ATGTVWLQGE GKEAGGRGQG AGEAGGELTA RFSPQSPIPN PQSPVPSPQS 
PELADLVWVT LTYPDGFKAY IHLCWLNNDK QRRLAVVGSL GTLIFDEMSP SSQLTLLHGE 
FERQGNLFLP VNQSREVLEL KAGEPLQRVC DRFITSVLQN TPPSISSGWV GTELVKILSA 
LTTSLQQSGQ SVSLQ