Gene Ava_4041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_4041
Symbol	aksA
ID	3682170
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	-
Start bp	5026243
End bp	5027361
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	46%
IMG OID	637719393
Product	trans-homoaconitate synthase
Protein accession	YP_324541
Protein GI	75910245
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0119] Isopropylmalate/homocitrate/citramalate synthases
TIGRFAM ID	[TIGR02660] homocitrate synthase NifV

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.397636
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAACG TGGTTATTCA CATTAACGAT ACAACCTTGC GAGATGGGGA ACAGGCGGCG 
GGTATAGCCT TTAATGTGGA AGAAAAAATT GCGATCGCCT CTCTACTCGA TTCTATCGGT 
GTTCACGAAT TAGAAGTTGG CATTCCCGCA ATGGGACATG AAGAAGCTGA ATCGATTACA 
AGGATTGCCA AATTAGGATT AAATGCCAAA CTACTCGGCT GGAATCGGGC GAATTTGTCA 
GATATCCAAG CATCTATCGA TTGTGGTTTG GATAGAGTTC ATGTTTCTGT TCCCGTCTCC 
GATATTCAGA TAGCTGCTAA ATTCAAAGGA CAACGACAGT TAGTCTTAGA TAAACTACGG 
GATGCAATTA ATTTTGCCTG CGATCGCGGT TTATCTGTCT CCGTCGGTGG CGAAGACTCT 
TCCAGAGCCG ATGAATCCTT CCTACTAGAA GTTGCCCAAT CTGCCCAAGA ATGGGGCGCG 
TTTCGGTTTC GCTTCTGTGA TACCGTAGGA ATTCTCGACC CCACAACCAC CTACAAAAAA 
GTTAGTCATT TGGTATCGCA CCTATCAATT GTTATCGAAA TGCACACACA TGACGACTTT 
GGTATGGCCT TAGCGAACAC CTTAGCCGGT GTAAAAGCTG GCGCGATATC TGTGAACACC 
ACCGTCAATG GTATAGGTGA ACGAGCCGGA AATGCACCCT TAGAAGAAGT AGTGATGGGA 
CTCAAATATC TCTACGATAT ACCCACAGGT ATTGATACCA AACGACTCGT AGAAGTATCA 
AGACTAGTCT CCAAAGCGAC TAATTTCCCT GTACTTCCTT GGAAAGCGAT CGTTGGTGAA 
AATACCTTTG CACACGAATC AGGGATTCAT GCTCATGGCG TACTGCAAAA CCCCATCACC 
TATGAACCAT TCGCACCAGA AGACGTAGGT TGGGAACGAC GCTTAGTAGT AGGTAAACAT 
TCCGGTCGCC ATCTCCTACT CAGCGTCCTG GAACAACACG GTATCACCCT CGGCCAAGCC 
GAAATTCAAT CAGTATTAGA TGCAGTCCGC CATCAATCAG TCAAAACCAA ACGCAGCCTC 
ACCGTTGAAG AACTACTAAG TTTAGTTCCT CAAAGATAA

Protein sequence

MNNVVIHIND TTLRDGEQAA GIAFNVEEKI AIASLLDSIG VHELEVGIPA MGHEEAESIT 
RIAKLGLNAK LLGWNRANLS DIQASIDCGL DRVHVSVPVS DIQIAAKFKG QRQLVLDKLR 
DAINFACDRG LSVSVGGEDS SRADESFLLE VAQSAQEWGA FRFRFCDTVG ILDPTTTYKK 
VSHLVSHLSI VIEMHTHDDF GMALANTLAG VKAGAISVNT TVNGIGERAG NAPLEEVVMG 
LKYLYDIPTG IDTKRLVEVS RLVSKATNFP VLPWKAIVGE NTFAHESGIH AHGVLQNPIT 
YEPFAPEDVG WERRLVVGKH SGRHLLLSVL EQHGITLGQA EIQSVLDAVR HQSVKTKRSL 
TVEELLSLVP QR