Gene Moth_1304 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1304
Symbol
ID	3831790
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1346992
End bp	1348209
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	58%
IMG OID	637829240
Product	aspartate kinase
Protein accession	YP_430160
Protein GI	83590151
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0527] Aspartokinases
TIGRFAM ID	[TIGR00656] aspartate kinase, monofunctional class [TIGR00657] aspartate kinase

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.506172
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCCTCA TCGTCCAAAA GTACGGCGGC ACTTCCGTTA ACGGCCCGGA ACGGGTCAAA 
AACGTAGCCC GCCGGGTAGT AAATACCCGA CGCGCCGGGA ACGACGTGGT CGTTATTGTG 
TCAGCTCCGG GCGATATGAC CGACGATCTC ATCGCCATGG CCCACGAGAT CAGCCCCAAC 
CCGCCGGCCA GAGAAATGGA CATGCTTCTG GCTACCGGGG AGCAGACATC GATAGCCCTC 
CTGGCCATGG CCATCCACGA GCTTGGCGAA CCGGTTATCT CCCTGACCGG CCCCCAGGTG 
GGCATCCTGA CCGACAACGT CCATTCCAAG GCGCGCATTA TGGAAGTGAG CTGCGAGCGC 
CTGCGCCGGG AATTAGAACA GGGCAAGATC GTTATTGTAG CCGGCTTCCA GGGCAAGACC 
TGTGAAGGCG AGATAACGAC CCTGGGCCGG GGAGGCTCCG ATACAACGGC CGTGGCCGTG 
GCCGCCGCCC TGAAGGCCGA CGTTTGCCAG ATCTATACCG ATGTGGACGG CGTTTATACG 
GCCGATCCCC GGGTGGTGCC GGAGGCCAGA AAATTACCGG TTATTTCCTA CGATGAAATG 
CTAGAATTGG CGAGTCTAGG TGCCCAGGTG CTGCAACCCC GGTCGGTAGA GTTTGGCAAA 
CTCAACCATG TCGTCCTCGA GGTACGATCA AGCTTTAATG ATCATGAAGG AACCCTGGTC 
AAAGAGGTGA CGGAAATGGA GAGGAAAATG GTCGTCAGCG GCGTAGCCGG TGACCGCAAC 
GTAGCCAGGA TAGCCCTGCA CGACGTCCCC GACCGGCCGG GCATCGCCAG GACCCTCTTT 
GTAGCCCTGG CCCGAGAGAG CATCAATGTT GATATGATCG TCCAGAGCGC CATGCGGGAC 
GGGATTAATG ATATCGCCTT CACCGTAGGG CGTGACGATC TCCAGAAGGC GGTTGAGGTA 
ACGGAAAGGG TACGTCAGGA AATTGGTGCC AGCAAGGTGA CTTCTAACGA CCGGGTGGCC 
AAGGTATCCA TCGTCGGCGC CGGTATGATC ACCAATCCCG GCGTGGCTGC CGACATGTTC 
GCCTGCCTGG CTGAGGAAGG CATTAATATT CACATGATCA GTACTTCAGA GATCAAGGTA 
TCCTGCATCA TTGACGAAGA ACACCTGACC CGGGCCATGC AAGCCCTGCA CCGTCACTTT 
AAACTGGACC GGGAGTAA

Protein sequence

MALIVQKYGG TSVNGPERVK NVARRVVNTR RAGNDVVVIV SAPGDMTDDL IAMAHEISPN 
PPAREMDMLL ATGEQTSIAL LAMAIHELGE PVISLTGPQV GILTDNVHSK ARIMEVSCER 
LRRELEQGKI VIVAGFQGKT CEGEITTLGR GGSDTTAVAV AAALKADVCQ IYTDVDGVYT 
ADPRVVPEAR KLPVISYDEM LELASLGAQV LQPRSVEFGK LNHVVLEVRS SFNDHEGTLV 
KEVTEMERKM VVSGVAGDRN VARIALHDVP DRPGIARTLF VALARESINV DMIVQSAMRD 
GINDIAFTVG RDDLQKAVEV TERVRQEIGA SKVTSNDRVA KVSIVGAGMI TNPGVAADMF 
ACLAEEGINI HMISTSEIKV SCIIDEEHLT RAMQALHRHF KLDRE