Gene EcHS_A0879 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A0879
Symbol
ID	5595432
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	885678
End bp	886943
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	56%
IMG OID	640920051
Product	hypothetical protein
Protein accession	YP_001457618
Protein GI	157160300
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	69
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTTCTA CTTTTACCAG CGACACATTG CCTGCCGATC ACAAAGCAGC TATCCGTCAG 
ATGAAGCACG CGCTGCGGGC GCAGCTTGGC GACGTCCAGC AGATCTTTAA TCAGCTAAGC 
GATGACATTG CCACGCGAGT GGCTGAAATC AACGCACTCA AAGCACAGGG CGATGCCGTC 
TGGCCGGTGC TGTCATATGC CGATATCAAA GCAGGTCATG TTACTGCAGA GCAGCGCGAA 
CAGATTAAAC GTCGCGGTTG TGCGGTGATA AAAGGCCATT TCCCCCGCGA ACAAGCGCTA 
GGCTGGGATC AGTCGATGCT GGACTATCTG GACCGCAACC GCTTTGACGA GGTCTACAAA 
GGCCCCGGCG ATAATTTCTT CGGGACGCTC AGCGCTTCAC GTCCCGAGAT TTACCCCATC 
TACTGGTCGC AGGCGCAAAT GCAGGCCCGC CAGAGTGAAG AAATGGCGAA TGCGCAGTCG 
TTTCTCAATC GTCTGTGGAC ATTTGAAAGT GATGGAAAAC AATGGTTTAA CCCGGATGTG 
AGCGTCATCT ACCCTGACCG TATCCGCCGC CGTCCGCCCG GAACGACCTC CAAAGGTCTT 
GGAGCGCATA CCGACTCCGG GGCACTGGAA CGCTGGCTGC TTCCAGCGTA TCAGCACGTT 
TTCGCCAACG TCTTTAATGG CAATCTGGCG AAATACGATC CCTGGCATGC GGCACATCGT 
ACGGAAGTTG AAGAGTACAC GGTGGACAAC ACCACCAAAT GTTCCGTGTT TCGGACATTC 
CAGGGCTGGA CAGCGCTCTC TGATATGCTA CCTGGTCAGG GACTGCTGCA CGTCGTGCCC 
ATTCCTGAAG CCATGGCGTA CGTACTGTTA CGTCCGCTGC TTGATGATGT GCCGGAGGAT 
GAACTGTGCG GCGTAGCGCC CGGAAGAGTG TTGCCGGTAT CAGAGCAATG GCATCCACTG 
TTAATTGAGG CGTTAACCAG CATTCCAAAA CTCGAGGCCG GAGACTCCGT CTGGTGGCAC 
TGCGACGTCA TCCATTCCGT TGCCCCCGTT GAAAATCAAC AGGGCTGGGG CAACGTGATG 
TACATTCCTG CGGCACCGAT GTGCGAGAAA AATCTTGCCT ACGCGCACAA GGTGAAGGCC 
GCACTGGAAA AAGGCGCATC GCCGGGCGAC TTCCCGCGCG AGGACTATGA AACAAACTGG 
GAAGGACGCT TTACGCTTGC CGACCTCAAC ATTCACGGTA AGCGAGCGTT GGGCATGGAC 
GTTTGA

Protein sequence

MASTFTSDTL PADHKAAIRQ MKHALRAQLG DVQQIFNQLS DDIATRVAEI NALKAQGDAV 
WPVLSYADIK AGHVTAEQRE QIKRRGCAVI KGHFPREQAL GWDQSMLDYL DRNRFDEVYK 
GPGDNFFGTL SASRPEIYPI YWSQAQMQAR QSEEMANAQS FLNRLWTFES DGKQWFNPDV 
SVIYPDRIRR RPPGTTSKGL GAHTDSGALE RWLLPAYQHV FANVFNGNLA KYDPWHAAHR 
TEVEEYTVDN TTKCSVFRTF QGWTALSDML PGQGLLHVVP IPEAMAYVLL RPLLDDVPED 
ELCGVAPGRV LPVSEQWHPL LIEALTSIPK LEAGDSVWWH CDVIHSVAPV ENQQGWGNVM 
YIPAAPMCEK NLAYAHKVKA ALEKGASPGD FPREDYETNW EGRFTLADLN IHGKRALGMD 
V