Gene ECH_0997 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH_0997
Symbol	hslU
ID	3927521
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ehrlichia chaffeensis str. Arkansas
Kingdom	Bacteria
Replicon accession	NC_007799
Strand	+
Start bp	1021414
End bp	1022877
Gene Length	1464 bp
Protein Length	487 aa
Translation table	11
GC content	33%
IMG OID	637902113
Product	ATP-dependent protease ATP-binding subunit HslU
Protein accession	YP_507784
Protein GI	88657724
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1220] ATP-dependent protease HslVU (ClpYQ), ATPase subunit
TIGRFAM ID	[TIGR00390] ATP-dependent protease HslVU, ATPase subunit

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTGTTA CACCAAATAA TAAACTCAAA TTGAATAATG ATACAACAAA TAATATAAAT 
GATGAACAAG CTAGTAGTGA AGTACTAAAT AGTGAAAACG CTATTAGCAC AGAAGGATAT 
GAAGATGACA TAAATCTAGA TGACTTATAC AACCCACAAG AATTAACTCC TCAGCAAATT 
ACACAGGAAC TAGATAGGTT TATTATAGGA CAAGCAGACG CAAAACGTGC TGTAGCCATT 
GCCTTAAGAA ATCGCTGGCG TCGTAACAGG GTACCTGAAC CATTAAGAGA AGAGATTATC 
CCTAAAAACA TCCTAATGAT AGGACATACA GGTATTGGTA AAACAGAAAT AGCTCGCAGG 
TTAGCAAAAC TTGCAAAAGC ACCTTTCATA AAAGTTGAAG CTACAAAATT TACTGAAATA 
GGATATGTAG GGAGAGATGT AGACTCTATT ATACGTGACT TAGTTGATGT AGCAATCAAT 
CTTGAAAAAG AAAAAAGTCG TAAATTTGTA GAGACAAAAG CAAAATCTTT AGCAGAAAAT 
ATAATTCTTG AAGCACTGGT AGGAGCTGAT GCAAGTCAAG AGACAAAAAC TATTTTTCAA 
GAAAAGCTAA GAAATGGTGA ATTTGAAAAT TTTGAGATCT CCATATCCAT AAAGGAAAGT 
AAAAATGCAA TCCCTTCTAT TGATATTCCA AATATTCCAG GAAATCAAGT TGGCATTATG 
AATATCAATG AGATTGTACA TAAAATGCTA GGAAATAACA AACAACTTAA GACTATAAAA 
GTTACTGTAA AAGAGGCAAG AGAACTGCTA ATTAATGAAG AAAGCGAAAA ATTAATGGAT 
GAAGATAAAA TCATCAAAGA CGCTCTTTTG TTAGCAAGTA ACGACGGCAT CGTATTTCTA 
GATGAAATAG ACAAAATTGC AGCTCGTACA GAAATCAGAG GAGAAGTGAA CAGAGAAGGT 
GTACAAAGAG ATCTTTTACC ATTACTTGAA GGAACAAGTG TAACAACAAA GTATGGTACT 
ATTACAACCG ATCACATTTT ATTCATAGCA TCTGGAGCAT TTCACTTGGC TAAACCTTCT 
GACTTATTAC CTGAGTTACA AGGACGTCTT CCTATACGAG TAGAACTGAA ACCGCTTAGT 
AAAGATGATT TAGTACGAAT TTTAACCGAA CCAGAATCAA GCTTATTAAA GCAATACTGC 
GCATTAATGA AAACAGAAAA TATTACTATT GACTTTACTG ATGAGGGAGT ATCTACTATA 
GCTGAAATAG CATCTACAGT TAACAGAGAG GTAGAAAATA TTGGAGCTCG TAGATTACAT 
ACCATTTTAG AAAAGCTAAT GGAAGATATC AGTTATACTG CAACAGAAAA TAGTGGTAGG 
ACATATGTGA TAGATAGCGA ATATGTAAAG AAAAAGCTAG AAGACATTGC AAAACAATTA 
GATTTATCAA AATTTATATT ATAG

Protein sequence

MFVTPNNKLK LNNDTTNNIN DEQASSEVLN SENAISTEGY EDDINLDDLY NPQELTPQQI 
TQELDRFIIG QADAKRAVAI ALRNRWRRNR VPEPLREEII PKNILMIGHT GIGKTEIARR 
LAKLAKAPFI KVEATKFTEI GYVGRDVDSI IRDLVDVAIN LEKEKSRKFV ETKAKSLAEN 
IILEALVGAD ASQETKTIFQ EKLRNGEFEN FEISISIKES KNAIPSIDIP NIPGNQVGIM 
NINEIVHKML GNNKQLKTIK VTVKEARELL INEESEKLMD EDKIIKDALL LASNDGIVFL 
DEIDKIAART EIRGEVNREG VQRDLLPLLE GTSVTTKYGT ITTDHILFIA SGAFHLAKPS 
DLLPELQGRL PIRVELKPLS KDDLVRILTE PESSLLKQYC ALMKTENITI DFTDEGVSTI 
AEIASTVNRE VENIGARRLH TILEKLMEDI SYTATENSGR TYVIDSEYVK KKLEDIAKQL 
DLSKFIL