Gene GM21_3019 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3019
Symbol
ID	8138365
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	3506887
End bp	3508104
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	58%
IMG OID	644870620
Product	aspartate kinase
Protein accession	YP_003022806
Protein GI	253701617
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0527] Aspartokinases
TIGRFAM ID	[TIGR00656] aspartate kinase, monofunctional class [TIGR00657] aspartate kinase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	111
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTTTGG TGGTCCAAAA ATACGGCGGA ACCTCGATGG GTTCTGTCGA ACGGATTCGT 
AACGTCGCTA AGAGGGTGGC GAAAACCTAC GATGCCGGCA ACGACATGGT GGTGGTAGTC 
TCCGCCATGT CCGGCGAAAC TAACAAGCTG GTGGCCCTTG CCAACGAAGT CTGCGAATTC 
CCGGACAACC GTGAATACGA CGTGCTGGTT GCAGCAGGCG AGCAGGTTTC CATCGCGTTG 
CTGGCCATGT GCCTTAAATC CATGGGGTAC AAAGCGAAAT CCTACTTGGG CTTCCAGGTT 
CCCATTCTGA CCGATAGCGC CTACGCAAAG GCGCGCATCG AGAAGATCGA CGACGCCAAG 
ATGCGCACCG ATTTGAAGGA AGGGACCATC CTCATCGTCG CGGGTTTCCA GGGTGTCGAC 
CCGTCCGGCA GCGTCACAAC GCTTGGGCGC GGCGGCTCGG ACACCTCGGC GGTCGCTCTC 
GCGGCGGCTC TGAAAGCGGA CGTTTGCGAA ATATTCACCG ACGTTGACGG GGTCTACACC 
ACCGATCCCA ACATCTGCAA GGACGCGAAG AAGATCGAGC GCATCTCCTA CGAGGAGATG 
CTGGAGCTGG CCAGCCTGGG CGCCAAGGTG CTCCAGATCC GCTCCGTCGA ATTCGCCAGC 
AAGTACAACG TCGACGTCCA TGTCCGCTCA AGCTTTAACG AAAATCTCGG AACCATGGTT 
ACCAAGGAGG ATAAAGATAT GGAAGCAGTA CTCGTCTCGG GTATCGCCTA TGCCAAGGAT 
GAAGTGAAAA TAGCTGTGAT GCAGGTTCCG GACAAGCCGG GGATCGCCGC CCAGATCCTG 
TCGCCGCTCT CCGATGCCAA TATCTCCGTG GACATGATCG TTCAGAACGT GAGCGAGGCC 
GGTTCCACCG ACTTCACCTT CACCGTGCCC CAGGCCGAAT TCAAGAAGGC GCTGGCCATA 
ACCCAGGAGA CCGCCCAGGC GATCAACGCC AAGGAAGTCC TCTCCGACGA GAACGTGAGC 
AAGGTCTCCA TCGTTGGCCT CGGCATGAGG AGCCACGCAG GGGTCGCCAC CACCATGTTC 
AAGGCGCTCG CCGCGGAAGG GATCAACATC CAGATGATCT CCACCTCCGA GATCAAGATC 
TCCGTCGTCG TCGACGCGAA GTACACCGAG CTCGCCGTAA GGGTGCTGCA CGACGTCTTC 
GGCCTGTCGG GGAAATAA

Protein sequence

MALVVQKYGG TSMGSVERIR NVAKRVAKTY DAGNDMVVVV SAMSGETNKL VALANEVCEF 
PDNREYDVLV AAGEQVSIAL LAMCLKSMGY KAKSYLGFQV PILTDSAYAK ARIEKIDDAK 
MRTDLKEGTI LIVAGFQGVD PSGSVTTLGR GGSDTSAVAL AAALKADVCE IFTDVDGVYT 
TDPNICKDAK KIERISYEEM LELASLGAKV LQIRSVEFAS KYNVDVHVRS SFNENLGTMV 
TKEDKDMEAV LVSGIAYAKD EVKIAVMQVP DKPGIAAQIL SPLSDANISV DMIVQNVSEA 
GSTDFTFTVP QAEFKKALAI TQETAQAINA KEVLSDENVS KVSIVGLGMR SHAGVATTMF 
KALAAEGINI QMISTSEIKI SVVVDAKYTE LAVRVLHDVF GLSGK