Gene ECH_0149 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH_0149
Symbol
ID	3927761
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ehrlichia chaffeensis str. Arkansas
Kingdom	Bacteria
Replicon accession	NC_007799
Strand	-
Start bp	139712
End bp	140710
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	37%
IMG OID	637901273
Product	pyruvate dehydrogenase subunit beta
Protein accession	YP_506977
Protein GI	88657756
COG category	[C] Energy production and conversion
COG ID	[COG0022] Pyruvate/2-oxoglutarate dehydrogenase complex, dehydrogenase (E1) component, eukaryotic type, beta subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAACTT TAACTGTACG AGAAGCACTA TGCGAAGCAA TACGTGAAGA AATGGAACGC 
GACCATACAG TACTAATTAT GGGAGAAGAA GTAGGTGAAT ATCAAGGTGC ATACAAAGTG 
ACCCAAGGAT TACTTGAACA ATTTGGCCCT GATAGAGTCA TAGATACTCC CATAACTGAA 
CATGGATTTG CTGGGATAGG GGTAGGTGCT GCATTTGCGG GACTGAAACC TATTGTAGAA 
TTCATGACTT TCAACTTTGC TATGCAGGCA ATAGATCAAA TTATTAACTC AGCAGCTAAA 
ACTAGTTACA TGTCTGGAGG ACAATTGAAC TGTCCTATTG TATTTAGAGG CCCCAATGGT 
GCAGCAGCAA GAGTAGGAGC ACAACATTCT CAATGTTATG CTTCATGGTA TGCACACATC 
CCTGGATTAA AAGTAGTATC CCCATATTTT GCAGCAGATT GTAAAGGTCT ATTAAAGGCA 
GCTATAAGGG ATTTAAATCC TGTTGTATTT CTTGAAAATG AGATCGCATA TGGACATAAG 
CATGAAATAC CAAATGAAGT ATCAACATCA GACTATATAA CCGAAATTGG GAAAGCAGCT 
ATAGTCAAGG AAGGAACTGA TATCACAATA ACAGCGTTTT CCCTACAAGT TAAATTCGCA 
CTAGAAGCAG CAGAACTTTT AGCAAAAGAA GGTATAAATG CAGAGGTTAT AGACTTAAGA 
ACGCTACGCC CTCTTGATAC AGAAACAATA TTACGTTCTA TTAAAAAAAC AAACAAAATT 
ATTAGCATAG AAGAAGGATG GCCATATTCA GGCATAGGAT CTGAAATAGC AGCATTGATA 
ATGGAATATG CATTTGATGA TTTAGATGCA CCAATGATAA GAATAACTGG AAAAGATGTA 
CCATTACCTT ATGCTACAAA CCTTGAAAAG TTAGCATTAC CACAAATTGA AGATATACTA 
GAAGCAGCAC GTGCTTTATG TATTCGCAAT TATAGATAA

Protein sequence

MRTLTVREAL CEAIREEMER DHTVLIMGEE VGEYQGAYKV TQGLLEQFGP DRVIDTPITE 
HGFAGIGVGA AFAGLKPIVE FMTFNFAMQA IDQIINSAAK TSYMSGGQLN CPIVFRGPNG 
AAARVGAQHS QCYASWYAHI PGLKVVSPYF AADCKGLLKA AIRDLNPVVF LENEIAYGHK 
HEIPNEVSTS DYITEIGKAA IVKEGTDITI TAFSLQVKFA LEAAELLAKE GINAEVIDLR 
TLRPLDTETI LRSIKKTNKI ISIEEGWPYS GIGSEIAALI MEYAFDDLDA PMIRITGKDV 
PLPYATNLEK LALPQIEDIL EAARALCIRN YR