Gene ECH_0629 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH_0629
Symbol	iscS
ID	3927819
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ehrlichia chaffeensis str. Arkansas
Kingdom	Bacteria
Replicon accession	NC_007799
Strand	+
Start bp	636623
End bp	637855
Gene Length	1233 bp
Protein Length	410 aa
Translation table	11
GC content	35%
IMG OID	637901751
Product	cysteine desulfurase
Protein accession	YP_507439
Protein GI	88658103
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1104] Cysteine sulfinate desulfinase/cysteine desulfurase and related enzymes
TIGRFAM ID	[TIGR02006] cysteine desulfurase IscS [TIGR03402] cysteine desulfurase NifS

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAACAAG AAAAACGACA AATCAATTTA CCTGTGTTTC TCGACTATCA ATCTACAACA 
AAAACAGATG ATAGGGTATT AGAAGCTATG ATGCCCTACT TTAAACAATT TTCTAATCCT 
CACTCACGCA GTCACTCCTT TGGCTGGAAA GCTGAATCAG CAGTTGAGTT AGCCAGGGAA 
AGAGTCGCAT CTTTAATAAA TGCCGAAGCT AAAGAAGTAA TATTCACTTC AGGTGCAACA 
GAATCAAATA ACTTAGCAAT TAAAGGAGTA GCAAACTTTT ATAAAAACAA AGGAAATCAT 
ATAATTACAG TACGTACAGA ACATAAATGC GTTTTAGATT CATGCCGTTA CTTAGAGACA 
GAAGGGTTTC ATGTTACTTA CTTAGACGTA CAAAAAAACG GTATCTTAGA TTTAGAGTTA 
TTAAAATCAT CTATCACTGA TAAAACAATA CTAGTATCAG TAATGATGGT GAACAATGAA 
ATTGGCGTTA TTCAACCAAT TGAAAAAATA GGAAAAATTT GTCATGAACA TGGAATATTT 
TTTCATACTG ATGCAGCTCA AGCTTTTGGA AAAATATCAA TAGATGTCAA AAAAATGAAC 
ATCGATCTTT TAAGTATATC AGGACACAAG ATATATGCTC CAATGGGAAT AGGAGCACTA 
TATATACGCA AACGCCAACC ACGAGTACGC CTTACTCCTA TGATTAACGG AGGTGGTCAA 
GAGCGTGGTA TGAGATCAGG AACAGTACCT ACTCCATTAG CTGTAGGGTT AGGAGAAGCA 
GCACGTATAG CTCAAGAAGT AATGGAGGAA GAAAACATCA GGATAAGAGA ATTGCGAGAC 
ATTTTATATA ATGAAATAAA AAAACACTTA CCATATGTCG TATTAAACGG GGATTACGAA 
CAACGTATAG CAGGAAATCT AAATTTAAGT TTTCCATATG TTGAAGGAGA ATCTATAATT 
ATGGCAATCA ATAATCTCGC AGTCAGTTCA GGTTCTGCTT GTACTTCTGC TTCTTTAGAA 
CCATCCTATG TTTTACGTGC TTTAAATATT GAAAAAGACT TAGAGCATTC ATCCATCAGA 
TTTGGTATAG GTAGGTTTAC TACAAGAGAA GAAATTTTAT ATGCCGCAGA GCTTATTGTT 
AGCAGCATAA AAAAATTACG TGAGATGAGT CCATTATGGG AAATGGTCCA AGAAGGTGTA 
GACCTTAATA ATATCAAATG GGATGCACAT TGA

Protein sequence

MEQEKRQINL PVFLDYQSTT KTDDRVLEAM MPYFKQFSNP HSRSHSFGWK AESAVELARE 
RVASLINAEA KEVIFTSGAT ESNNLAIKGV ANFYKNKGNH IITVRTEHKC VLDSCRYLET 
EGFHVTYLDV QKNGILDLEL LKSSITDKTI LVSVMMVNNE IGVIQPIEKI GKICHEHGIF 
FHTDAAQAFG KISIDVKKMN IDLLSISGHK IYAPMGIGAL YIRKRQPRVR LTPMINGGGQ 
ERGMRSGTVP TPLAVGLGEA ARIAQEVMEE ENIRIRELRD ILYNEIKKHL PYVVLNGDYE 
QRIAGNLNLS FPYVEGESII MAINNLAVSS GSACTSASLE PSYVLRALNI EKDLEHSSIR 
FGIGRFTTRE EILYAAELIV SSIKKLREMS PLWEMVQEGV DLNNIKWDAH