Gene Ava_1554 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_1554
Symbol
ID	3682286
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	-
Start bp	1908495
End bp	1909991
Gene Length	1497 bp
Protein Length	498 aa
Translation table	11
GC content	48%
IMG OID	637716894
Product	aldehyde dehydrogenase
Protein accession	YP_322072
Protein GI	75907776
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.220201
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAACTC CCCTAAACTG CCAAAATTAC ATCAATGGTC AATGGTTAAA CGCCGCCACA 
GAAACCACCC TCAACAGTCA CAACCCTGCT AACAAGAGCG AAATTGTTGC TACTTTCCCC 
CGTTCTCAAG CTGACGATAC AGATAGAGCC GTCACCGCCG CCCGTCAAGC CTATGGCAGT 
TGGCGCAAAG TCCCAGCCCC AGCCAGAGCC GAATATATCT TTCGCGTCGG TGAATTATTA 
CTCCAACATA AAGAAGAACT AGCCCAATTA ATTAGTCGGG AAATGGGTAA ACCCATAACT 
GAAGCTAGGG GCGATGTGCA GGAAGGTGTT GACTGTGCAT TTTATAGCGC TGGTGAAGGA 
CGGCGACTGT TTGGGCAAAC CACACCATCC GAAATGCCCA ACAAATTCGC CATGACAGTG 
CGAATGCCCA TCGGAGTTTG TGCTTTAATT ACTCCCTGGA ACTTCCCCGT AGCCATTCCT 
TGCTGGAAAG CAATGCCAGC TTTGGTTTGT GGTAATACGG TGATTCTCAA ACCTGCGGAA 
GACACCCCCG CCTGTGCCAC AAAATTAATT GAGATTTTCG CCGCCGCAGG TTTACCACCG 
GGTGTAATTA ACTTGGTGCA TGGAGTCGGG GAAGAAGCAG GGAAAGCTTT AGTCGAACAT 
CCAAATATTG ATTTAGTTTC ATTTACTGGT TCTTCCGCCA CTGGTGCCTA TGTTGGTGAG 
ACTTGTGGGC GCACTCACAA GCGCGTCTGT TTGGAGATGG GTGGGAAAAA TGCCCAAGTG 
GTGATGGAAG ATGCAGATTT AGAACTTGCC CTTGATGGGG CATTGTGGGG AGCCTTCGGC 
ACAACAGGAC AACGATGTAC AGCTACCAGT CGCTTAATTT TACATCGTGA TATCAAAGAA 
AAATTTACAA CCATGCTGCG TGAACGCACC AGCCAACTAC GCTTGGGTGC TGGTACAGAA 
CCTGAGACAG ATATCGGCCC GATAATCAAT AACCGACAGT TGCAACGGGT ACATGAATAT 
ATGAATATTG CCCGTGAAGA AGGGGCCAAG ATTTTAATCG GTGGGGAAAT TGTCACCGAG 
GGACAATTAA AACAGGGTTA CTTTTTTCAA CCAACAATTT TAGATAATGT CACCCCACAG 
ATGCGTGTTG CCCGTGAAGA GATATTCGGG CCAGTAGTAG CATTGATTGA GGTTAGCACC 
TTTGAAGAAG CGATCGCTAT CCTTAACGAT ACCAAATACG GTCTTTCCTC CTCAGTCTAC 
ACCCGTGACA TCAATCGCGC CTTTGTTGCC ATGCGCGACA TTGAAGTCGG TATCACCTAC 
ATCAACGGCC CCACCATTGG CGCAGAAGTA CACCTGCCTT TTGGTGGTGT CAAACAAACC 
GGTAACGGAC ACCGGGAAGC AGGCACCACC GCTTTAGATG TGTTCACAGA ATGGAAAAGC 
GTTTACGTAG ACTTTTCCGG CAGTTTACAA CGCGCGCAAA TTGATAACAG GAGTTAG

Protein sequence

MKTPLNCQNY INGQWLNAAT ETTLNSHNPA NKSEIVATFP RSQADDTDRA VTAARQAYGS 
WRKVPAPARA EYIFRVGELL LQHKEELAQL ISREMGKPIT EARGDVQEGV DCAFYSAGEG 
RRLFGQTTPS EMPNKFAMTV RMPIGVCALI TPWNFPVAIP CWKAMPALVC GNTVILKPAE 
DTPACATKLI EIFAAAGLPP GVINLVHGVG EEAGKALVEH PNIDLVSFTG SSATGAYVGE 
TCGRTHKRVC LEMGGKNAQV VMEDADLELA LDGALWGAFG TTGQRCTATS RLILHRDIKE 
KFTTMLRERT SQLRLGAGTE PETDIGPIIN NRQLQRVHEY MNIAREEGAK ILIGGEIVTE 
GQLKQGYFFQ PTILDNVTPQ MRVAREEIFG PVVALIEVST FEEAIAILND TKYGLSSSVY 
TRDINRAFVA MRDIEVGITY INGPTIGAEV HLPFGGVKQT GNGHREAGTT ALDVFTEWKS 
VYVDFSGSLQ RAQIDNRS