Gene GM21_2146 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_2146
Symbol	aksA
ID	8137482
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	2504905
End bp	2506053
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	64%
IMG OID	644869761
Product	trans-homoaconitate synthase
Protein accession	YP_003021956
Protein GI	253700767
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0119] Isopropylmalate/homocitrate/citramalate synthases
TIGRFAM ID	[TIGR02660] homocitrate synthase NifV

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	82
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGGAT TTCCCAAGGC CCAGGTTTTC ATCGCAGACA CCACGCTGCG AGACGGCGAA 
CAGACGGCGG GGGTGGTCTT CACAGCGAAG GAAAAAATCT CCATCGCGAG GCAGTTGGAC 
GCCATGGGGG TCCACGAACT GGAATGCGGG ATTCCCGCCA TGGGCGAGGA GGAGCGCGAC 
TCGATCCGGG CACTTGTGGC GTTGGGCCTT TCGGCCCGGC TCGTCACCTG GAACCGCGCG 
CTGGTGTCGG ACATCGAGGC GAGCATCGCC TGCGGCATCA AGGCCGTGGA CATCTCGCTC 
TGCGTCTCGG ACATCATGAT CGAACACAAG ATCAATAAGA GCAGGGCATT TGTGAAGGAA 
CAGCTGAAGC GGGCGCTATG CTTCGCCAAG GATAAGGGGC TCTACGTCTG CGTCGGGGGC 
GAGGACGCCA GCCGCGCCGA CGGCGATTTC CTGATCGAGC TGATGCAGAT CGCCCAGGCA 
AACGGCGCCG AGCGCTTCCG GTTCTGCGAC ACGCTCGGCA TCCTCGACCC CTTTGCCATG 
TTCGAAAAGG TGGGGCGCCT GAGAGCCGCG GTCCCCGGTC TCGACATCGA GGTGCACACC 
CACAACGACC TCGGGCTTGC CACGGCGAAC GCCCTGGCAG GGGTGAGGGG AGGGGCTTCC 
TACATCAGCA CCACGGTCAA CGGCCTCGGC GAGCGGGCGG GGAACGCCGC GCTGGAAGAG 
GTGGTCATGG CGCTGAAGGT CGCCTGCGGC ATCGATGCCG GCATCGACAC CAGGCGTTTT 
AAGTCGGTGT CCCGGCTGGT GGGACGCGCC TCCAACCGCG AGGTCCCCCC CTGGAAGGCC 
GTCGTGGGAG AGAGGGTCTT CTCGCACGAA TCCGGGCTGC ATGCGGACGG CGTTCTGAAG 
GACCCGAGGA ACTACGAGGG GTTCACCCCT GAGGAAGTGG GGCTCAAAAG GCATATCGTC 
GCGGGGAAAC ATTCCGGGAC CAACGGGATC GTGGAAAGCT ACCGTCAGAT CGGCATCCCC 
ATTTCCAGGG AGGAGGCGCA GGAGCTGATG GACAAGGTGA GGAGCACGGC TCAGCGCATC 
AAGGGCGCGC TGGCCCCGGT GGACCTGCTC AAACTGCACC AGGGGAGAGG GGTTTCGCTG 
GCTGCTTAG

Protein sequence

MAGFPKAQVF IADTTLRDGE QTAGVVFTAK EKISIARQLD AMGVHELECG IPAMGEEERD 
SIRALVALGL SARLVTWNRA LVSDIEASIA CGIKAVDISL CVSDIMIEHK INKSRAFVKE 
QLKRALCFAK DKGLYVCVGG EDASRADGDF LIELMQIAQA NGAERFRFCD TLGILDPFAM 
FEKVGRLRAA VPGLDIEVHT HNDLGLATAN ALAGVRGGAS YISTTVNGLG ERAGNAALEE 
VVMALKVACG IDAGIDTRRF KSVSRLVGRA SNREVPPWKA VVGERVFSHE SGLHADGVLK 
DPRNYEGFTP EEVGLKRHIV AGKHSGTNGI VESYRQIGIP ISREEAQELM DKVRSTAQRI 
KGALAPVDLL KLHQGRGVSL AA