Gene ECH_1001 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH_1001
Symbol
ID	3927752
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ehrlichia chaffeensis str. Arkansas
Kingdom	Bacteria
Replicon accession	NC_007799
Strand	+
Start bp	1026178
End bp	1027431
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	32%
IMG OID	637902117
Product	aspartate kinase
Protein accession	YP_507788
Protein GI	88657747
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0527] Aspartokinases
TIGRFAM ID	[TIGR00656] aspartate kinase, monofunctional class [TIGR00657] aspartate kinase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAGGA TTTTAGTAAA AAAATTTGGA GGAACTTCTT TACAAGACAT AGAATGCATT 
AATAGAGTTG CAGAAATAAT AAAACAAGAT GTTAACAATA ATTATAAAGT AGTTGTAGTA 
GTATCAGCTA TGGGAAAATT CACTGATAAC ATCATTTCAC AAATTAAACA AATTTCCGAT 
GTCAAATCTC AATCTGAACG CTCCGAATAT GATCTAATCA TTTCTTCAGG AGAACAAATA 
TCATGCGGAC TATTATCATT AGCTCTACAA AAAATAGGAA TCAATGCTCA ATCATGGTTA 
GGATGGCAAC TACCAATAGT AACAACTGAA GACCATACTA AAGCAAGAAT CATAGATATT 
AACACATGTT CACTACAGGA TTCACTAGCT AATAATGATG TTGCTATTGT GGCTGGATTT 
CAGGGAATGC ATAAAAACAA TAGAGTAACA ACCTTAGGCA GAGGAGGTTC TGACACTTCA 
GCTGTAGCAA TTGCAGCAGC ACTAAAAGTA GATTTATGCT ACATTTACAC AGATGTAGAC 
GGAATATATA CAGCAGATCC TAATGTGGTA CCAAAAGCAC GCAAATTAGA TTACATTACA 
TATGATGAAA TGATAGAGAT GTCTTCTCTT GGCGCTAAAG TATTACAAGT ACGTTCAGTA 
GAAATAGCAA TGAAATATAA CATAAAATTG TGTATATTAT CTACTTTTAA TCCTGGAAAA 
GGGACAATCT TACGCAAAAA AGGAGAATCA GATATGGAAA GTCAATTAAT TACTGGGGTT 
ACATGTAATA ACAAAACAGC AAGTATTACA CTAAAAGAGG TAAAAGCAAT ATCTGGCGTT 
ACCACAGTAT TTAATGCAAT AGCAGAAAAA AACATTAACG TCGATATGAT CATTCAAAGT 
GTGAATGATA ACAATGCAAA TGATATCACT TTTACAATTT CAGAAGAAGA TTTGCCAACA 
ACAACAAAGT TTTTAACAGA AATTCAAACT GAACTTATGT ATCAGGATTT AATAATCAAT 
TCCGAAGTTG CAAAAGTTTC CATTATTGGA GTAGGCATGA TTTCTCATTC TGGAGTAGCT 
TACAAAATGT TTGATACTTT AACATCTAAT AATATAAAAA TATTAGCAGT TACTACTTCA 
GAGATAAAAA TCAGCGTTCT AATATCGAGA AAAGACAGCC AACTTGCAAC AATAGCATTG 
CACTCTACTT TTGGACTTGA TAACACAGAA TCAGATTTAC ACATAATAAG TTAA

Protein sequence

MKRILVKKFG GTSLQDIECI NRVAEIIKQD VNNNYKVVVV VSAMGKFTDN IISQIKQISD 
VKSQSERSEY DLIISSGEQI SCGLLSLALQ KIGINAQSWL GWQLPIVTTE DHTKARIIDI 
NTCSLQDSLA NNDVAIVAGF QGMHKNNRVT TLGRGGSDTS AVAIAAALKV DLCYIYTDVD 
GIYTADPNVV PKARKLDYIT YDEMIEMSSL GAKVLQVRSV EIAMKYNIKL CILSTFNPGK 
GTILRKKGES DMESQLITGV TCNNKTASIT LKEVKAISGV TTVFNAIAEK NINVDMIIQS 
VNDNNANDIT FTISEEDLPT TTKFLTEIQT ELMYQDLIIN SEVAKVSIIG VGMISHSGVA 
YKMFDTLTSN NIKILAVTTS EIKISVLISR KDSQLATIAL HSTFGLDNTE SDLHIIS