Gene Athe_1961 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1961
Symbol
ID	7407375
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	2073961
End bp	2075190
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	39%
IMG OID	643716333
Product	aspartate kinase
Protein accession	YP_002573821
Protein GI	222529939
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0527] Aspartokinases
TIGRFAM ID	[TIGR00656] aspartate kinase, monofunctional class [TIGR00657] aspartate kinase

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.000119099
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGGAATAG TTGTCCAAAA GTATGGTGGA ACATCTGTTG CAGACAAAGA AAGAATATTT 
AGAGCAGCAA AGCGGGCAAT TAGCGAGTAT GAAAAAGGAA ACAAGGTTGT GGTTGTTGTC 
TCAGCTCAAG GCGATACAAC AGATGAGCTT ATTGAAAAGG CAAAAGAGAT AAACGAAAAT 
CCTTCAAAAA GAGAGATGGA TGTGCTCCTT TCTACCGGTG AACAGATTTC GATTGCACTT 
ATGGCAATGG CAATTGAAAA GCTTGGGTAT CCTGTCATTT CGCTGACTGG TTGGCAGGCA 
GGAATAAAGA CAGATAGCCA TTATTCAAAT GCAAGAATCA TTGAAATTGA CACAGAAAGG 
CTCCAAAGAG AGCTTGATAA AAGGAACATA GTTGTTGTTG CAGGTTTTCA GGGAATAAAT 
AAGTATGATG ATATAACCAC GCTGGGGCGT GGAGGATCTG ATACAACAGC TGTAGCTTTG 
GCTGCAGCTT TGAAAGCTGA TAAGTGCGAA ATATATACAG ATGTTGACGG TGTTTATACA 
GCAGACCCAA GAATTGTTCC AAACGCATCA AAGCTCAAAG AAATTTCTTA TGATGAGATG 
TTAGAGCTTG CCACACTTGG TGCAAAGGTA CTTCATAACA GGTCTGTTGA GCTTGCAAAA 
AAATACAATA TTCCCCTTGT TGTTAGGTCA TCTTTCAACG ACAATGAAGG AACAATTGTA 
AAGGAGGTAA ATTCGGTGGA AAAGCTTTTA GTATCCGGTG TTGCGTGTGA CAAGGATATT 
GCAAGGGTTG CAGTGATTGG AGTTGAAAAT ATTCCGGGCA AGGCATTTCA GATATTTTCA 
CTTTTGGCAA AAGAAAATAT AAATGTTGAT ATAATTTTGC AGTCAATTGG AAGAGAAAAA 
ACAAAGGATA TATCGTTTAC AGTATCAAAG AGCAACTTGA AGCAGACACT TGATGTTTTG 
ACAAAGAATC TGCACATAAT TGGCGCAAAG GATATAACAT ATGCTGACAA TGTTGCAAAG 
GTCTCTATAG TTGGTGCTGG AATGGTCAAC AATCCAGGCG TTGCTGCAAT GATGTTTGAA 
GCTCTTTATG ATGCAGGTAT CAACATCGAG ATGATTTCGA CATCCGAGAT AAAGATATCA 
GTCTTGATTG ACGAAAAGGA TGCTGAAAAA GCAGTCAGAG CTATACATGA CAAGTTCAAA 
CTTCATCTTT TGAACAGTAA TGGTAAATAA

Protein sequence

MGIVVQKYGG TSVADKERIF RAAKRAISEY EKGNKVVVVV SAQGDTTDEL IEKAKEINEN 
PSKREMDVLL STGEQISIAL MAMAIEKLGY PVISLTGWQA GIKTDSHYSN ARIIEIDTER 
LQRELDKRNI VVVAGFQGIN KYDDITTLGR GGSDTTAVAL AAALKADKCE IYTDVDGVYT 
ADPRIVPNAS KLKEISYDEM LELATLGAKV LHNRSVELAK KYNIPLVVRS SFNDNEGTIV 
KEVNSVEKLL VSGVACDKDI ARVAVIGVEN IPGKAFQIFS LLAKENINVD IILQSIGREK 
TKDISFTVSK SNLKQTLDVL TKNLHIIGAK DITYADNVAK VSIVGAGMVN NPGVAAMMFE 
ALYDAGINIE MISTSEIKIS VLIDEKDAEK AVRAIHDKFK LHLLNSNGK