Gene ECH_0045 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH_0045
Symbol
ID	3927524
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ehrlichia chaffeensis str. Arkansas
Kingdom	Bacteria
Replicon accession	NC_007799
Strand	-
Start bp	42310
End bp	43407
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	30%
IMG OID	637901169
Product	putative GTP cyclohydrolase II
Protein accession	YP_506877
Protein GI	88657727
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0807] GTP cyclohydrolase II
TIGRFAM ID	[TIGR00505] GTP cyclohydrolase II

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAAATT TATTTAACAG ATTTCACTCC AACAAGTATA TTACAGAAAA GTCTATCGCA 
GAACTAAGAT GTGGTATCCC AGTATTGCTA TATAACAGCA ATGATAGCTT ACTCATCTTC 
CCCAGCGAAT TAATAGATAA TCAATTACTA AACACATTGA AAAAACATTT TAAAGATATC 
AACATATTAG TAACCGGTAA TAGATTAAAC TTCATCTTCC AATCTTCAGG AAACCAACTC 
TCAAGAATCA AAATTAAAGA ATCTCATGAT CTAGAATATA TATCCTCCCT ACTAACAGGT 
CAAGAATTAC ACAAAGGATC TCTTGTTATT GATAATGTGA CAGTAAGTAC AAACTCTTTA 
GATATAACTG CTATTTCCCT AATAAAATTA ACAAAACTAT TACCCTCAGC AGTTGTTGTT 
GATATCAATG ATTCTGATGT ACTACATTGG TGTACTAAAA ACAACATCAC ACCTATAAGA 
CAAGAAATAA TCGAGAATTA TAATAAAGAA TATGAAATTC AGGAAGTATG TAGTTCACCT 
TTATTTCTAA AAGACTGTTC CAATGCTAAA ATAAATGTTT ACAGATCACA TACTGGGGAA 
CTTGAACATT ACGCAATTAT TATAGAAAAT CCAGATTATA GCAATCCTAT CATTAGGATT 
CATTCTTCAT GTTACACTGG TGACCTACTT AACAGCTTAT CTTGTGATTG TCGATGTCAA 
CTACATACTG CCATAAAGTT AATGATAGAA AATAAAGGTG GAATAATTTT ATACTTAGCC 
CAGGATGGTC GTGGTATAGG GCTAGCTAAC AAAATAAGAA CATATCAACT ACAAATAAAA 
CACAATTTTG ATACTGTAGA TGCTAATAGA TTCTTTGGAT TTGAAGATGA TGAAAGGGTA 
TTCATCCCAG CTATAAAAAT ACTACAGAAA TTGGGAATTT CAAGATTGCA ATTATTAACA 
AACAATCCAA ATAAAATTTC AGAAATTCAG AATCACGGCA TACAAGTTAC AAAAATATTA 
CCTATTTTTG TTGACACAAA TCAACATAAT ATTAATTATA TCAATACTAA AGCTAAAAGG 
TTAGGTCACG TTTGCTAG

Protein sequence

MENLFNRFHS NKYITEKSIA ELRCGIPVLL YNSNDSLLIF PSELIDNQLL NTLKKHFKDI 
NILVTGNRLN FIFQSSGNQL SRIKIKESHD LEYISSLLTG QELHKGSLVI DNVTVSTNSL 
DITAISLIKL TKLLPSAVVV DINDSDVLHW CTKNNITPIR QEIIENYNKE YEIQEVCSSP 
LFLKDCSNAK INVYRSHTGE LEHYAIIIEN PDYSNPIIRI HSSCYTGDLL NSLSCDCRCQ 
LHTAIKLMIE NKGGIILYLA QDGRGIGLAN KIRTYQLQIK HNFDTVDANR FFGFEDDERV 
FIPAIKILQK LGISRLQLLT NNPNKISEIQ NHGIQVTKIL PIFVDTNQHN INYINTKAKR 
LGHVC