Gene Ava_0334 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_0334
Symbol
ID	3682767
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	+
Start bp	430840
End bp	431970
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	38%
IMG OID	637715662
Product	phospho-2-dehydro-3-deoxyheptonate aldolase
Protein accession	YP_320855
Protein GI	75906559
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0722] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR00034] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.362439
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGAATT TGTGTTGTAC ATTTCATCTA CAATATGTAT ACCCAATCTG CCTAAAATCC 
TACCCAGACA ATCTAGAGCA ATCCTCCATG CACAATAAAT TAACTAACGC AAATATTGAA 
AATTATCACG TTCTCTTAAC TCCAAACGAA GTAAAAGAAA AATTACCGTT AACAGAAACT 
GCGGCAGAAA TAGTTTTACA GTTTAGATGT GAAATAGAGA AAATATTAGA TTTTCAAGAT 
AGACGCAAAT TTATAGTAGT TGGGCCTTGT TCTATTCATG ACCCTAATGC AGCATTGGAA 
TACGCCCATA AGTTAAAAAA ATTAGCCGAA CGCGTCCAGG ATAAACTACT GTTAATTATG 
CGGGTTTATT TTGAAAAGCC CCGCACAACT GTAGGCTGGA AAGGATTAAT TAATGATCCA 
GAAATGGATG ATTCTTTTCT GGTGGAAAAT GGCTTATTAC TAGCCAGAGA TTTACTCATC 
AAGTTAACAG AGTTAGGGCT ACCCACCGCT ACAGAGGCTC TAGACCCTAT TGTACCGCAA 
TATATTGGTG AATTGATCAC ATGGGCGGCG ATCGGCGCAC GCACAACGGA ATCCCAAACT 
CACAGGGAAA TGGCTAGCGG TCTCTCTATG CCTGTGGGTT TCAAAAATGG CACTGATGGT 
AATATTCAAG TAGCTTTAAA TGCTTTACAT TCTGCCAGAA TGCCGCATAA TTTTTTGGGC 
ATTAATCCTG ACGGACAGGT AAGTGTATTT GAAACGAAAG GTAATGCCTA CGGTCATGTT 
ATTTTGCGTG GAGGAAATCA ACCTAATTTT GATTCTGAAA GTGTTAGACA AGTAGAAGAA 
AAATTAAAGC AGGCTAAATT ACCTCCAAGA ATTGTCATTG ATTGTAGTCA TGGTAATACT 
AATAAAAATT ACAGGCTACA ATCTGATGTT TTAGAAAACG TTGTGCAACA GATAGTTGAT 
GGTAATACAT CGATTGTAGG GATGATGCTG GAATCAAATT TATATGAAGG GAATCAACCC 
ATTAACTGCA AACGGGAAGA ATTGAAATAT GGGGTTTCTG TAACTGACCC CTGTATCGGT 
TGGGAGCAAA CGGAAAAAAT TATCTTGGCT GCTTACGAAA AACTTAATTG A

Protein sequence

MMNLCCTFHL QYVYPICLKS YPDNLEQSSM HNKLTNANIE NYHVLLTPNE VKEKLPLTET 
AAEIVLQFRC EIEKILDFQD RRKFIVVGPC SIHDPNAALE YAHKLKKLAE RVQDKLLLIM 
RVYFEKPRTT VGWKGLINDP EMDDSFLVEN GLLLARDLLI KLTELGLPTA TEALDPIVPQ 
YIGELITWAA IGARTTESQT HREMASGLSM PVGFKNGTDG NIQVALNALH SARMPHNFLG 
INPDGQVSVF ETKGNAYGHV ILRGGNQPNF DSESVRQVEE KLKQAKLPPR IVIDCSHGNT 
NKNYRLQSDV LENVVQQIVD GNTSIVGMML ESNLYEGNQP INCKREELKY GVSVTDPCIG 
WEQTEKIILA AYEKLN