Gene ECH_0910 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH_0910
Symbol
ID	3926966
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ehrlichia chaffeensis str. Arkansas
Kingdom	Bacteria
Replicon accession	NC_007799
Strand	-
Start bp	935108
End bp	936247
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	30%
IMG OID	637902027
Product	hypothetical protein
Protein accession	YP_507702
Protein GI	88657814
COG category	[R] General function prediction only
COG ID	[COG0628] Predicted permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCATGTGC ATAGACTAAT GAGCGATCAA TTTTGCAAGC TAATTAATAG GTATGTAACA 
CGTAGTGTTA TTGTACTAGC AATTGTTTTG GTGATGTTTG TTATTAAACC TGTACTTGCT 
CCGTGTTGTA CTGCTATGAT AATGGCTTAT CTTCTTAATC CATTGGTGGA TAAGTTACAA 
AGATTTAAAC TATCAAGGCA ACTATCTGTT GCTATAATTT TGCTATCTTC GTTGTGTGTA 
ATTATAGCAT TTTTGGTCAG TTTTATTCCC CTTGCTTATT CTCAGTTGTT ATCACTTATA 
AAGTTTCTTA TGGAAAAAGT GCCATTGATT CATAAAGACA GTATCATTTC TCTCCTTCAG 
AAATATAATA TGATTGATTA TGAAGAAGTA TCGGATGCAA TAAAGTTGCC GCAAGCGTCT 
TTAAAAAGTT TGTTGCATTA CGAAAACATT AAACCTCTTG TAAGTATTTT TGGAAATTTT 
CTAAAAAATT TAGATGGTAT ATTGTTTAGT GCAATAAATT CTAGTATAAG CATTAGTTAT 
ACAATTTCTA TAATATTAAT AACTCCTCTA TTATTATTTT ATATATTATG TAACTGGCCA 
TCGATTGTTG AATCTGCTGA TGCACTAGTT CCTGTAAAAT ATCAAAGTAT TGCTAGATTA 
TATACAAAAA AAATAGACCA AGTAATTTCA GCTTATATTA GAGGCCAATT AAGTGTATGT 
TTTATCATGG CTGTATACTA CATTATATGT TTTAGTTTGG TGAAGTTAAA GTATTTTTTA 
ATTATAGGTT TTGTATCGGG AATCATGACT TTTATTCCAT ATATAGGACC TATTTCATGT 
GCAATATTGA GTTCCATTAC AACAATGTTA CAGTTTAATG ATTGGACGAT GTGTGGAGTG 
GTAGTGACAA TGTTCATTGT TGGACAGTTA GTTGAGTCGA ATATTATTAC TCCATTATTA 
ATAGGAAAAC GGGTAGATAT ACATCCTATA TGGATAATTA TTGGAATGAT AACATGTGGA 
TCACAAATTG GATTTACAGG GGTATTATTG TCAATTCCTA TAACAGCAAT AGTTGGTGTA 
TTTGTAAGAG CACTTATAGC CCACTATATG GGTAGTAAAT TTTATAATAA TGCTGATTGA

Protein sequence

MHVHRLMSDQ FCKLINRYVT RSVIVLAIVL VMFVIKPVLA PCCTAMIMAY LLNPLVDKLQ 
RFKLSRQLSV AIILLSSLCV IIAFLVSFIP LAYSQLLSLI KFLMEKVPLI HKDSIISLLQ 
KYNMIDYEEV SDAIKLPQAS LKSLLHYENI KPLVSIFGNF LKNLDGILFS AINSSISISY 
TISIILITPL LLFYILCNWP SIVESADALV PVKYQSIARL YTKKIDQVIS AYIRGQLSVC 
FIMAVYYIIC FSLVKLKYFL IIGFVSGIMT FIPYIGPISC AILSSITTML QFNDWTMCGV 
VVTMFIVGQL VESNIITPLL IGKRVDIHPI WIIIGMITCG SQIGFTGVLL SIPITAIVGV 
FVRALIAHYM GSKFYNNAD