Gene EcHS_A2667 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A2667
Symbol
ID	5591630
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	2679470
End bp	2680483
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	54%
IMG OID	640921783
Product	cytoskeletal protein RodZ
Protein accession	YP_001459309
Protein GI	157161991
COG category	[S] Function unknown
COG ID	[COG1426] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	47
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATACTG AAGCCACGCA CGACCAAAAT GAAGCACTTA CTACCGGCGC TCGCCTGCGT 
AATGCTCGCG AACAACTAGG ACTTAGTCAG CAGGCCGTTG CCGAGCGACT TTGCCTGAAG 
GTTTCCACGG TACGCGACAT TGAAGAAGAT AAGGCACCCG CCGATCTTGC TTCAACATTC 
CTGCGCGGAT ATATCCGCTC TTATGCGCGT CTGGTACATA TTCCAGAAGA AGAACTGCTG 
CCAGGGCTGG AAAAGCAGGC TCCACTACGG GCTGCAAAAG TTGCGCCAAT GCAGAGTTTT 
TCCCTCGGTA AACGCCGCAA AAAACGTGAT GGCTGGCTGA TGACCTTCAC CTGGCTGGTG 
TTGTTTGTGG TTATCGGCCT GAGCGGTGCC TGGTGGTGGC AAGACCACAA AGCTCAGCAG 
GAAGAGATCA CCACTATGGC CGATCAATCT TCGGCGGAAC TGAGCAGTAA TAGCGAGCAG 
GGGCAGAGTG TTCCGTTAAA TACGTCGACA ACTACAGACC CGGCTACAAC GTCCACGCCG 
CCAGCGTCTG TGGATACTAC CGCAACCAAC ACGCAAACAC CTGCCGTAAC TGCGCCAGCA 
CCAGCTGTTG ATCCGCAACA GAATGCGGTT GTTTCGCCTT CGCAGGCAAA TGTTGATACC 
GCCGCGACCC CGGCACCAAC GGCAGCAACA ACGCCAGATG GTGCTGCGCC GTTGCCAACC 
GATCAGGCTG GCGTGACCAC GCCGGTGGCT GATCCGAATG CGCTGGTGAT GAACTTTACT 
GCCGATTGCT GGCTGGAGGT CACTGATGCT ACCGGTAAAA AATTGTTTAG CGGTATGCAG 
CGTAAAGACG GTAATTTGAA CTTAACCGGC CAGGCACCGT ACAAACTGAA AATTGGTGCG 
CCAGCCGCAG TACAGATCCA GTATCAAGGG AAACCTGTCG ATCTGAGTCG TTTTATCAGA 
ACTAACCAGG TTGCGCGTCT GACCCTCAAT GCCGAACAAT CACCGGCGCA GTAA

Protein sequence

MNTEATHDQN EALTTGARLR NAREQLGLSQ QAVAERLCLK VSTVRDIEED KAPADLASTF 
LRGYIRSYAR LVHIPEEELL PGLEKQAPLR AAKVAPMQSF SLGKRRKKRD GWLMTFTWLV 
LFVVIGLSGA WWWQDHKAQQ EEITTMADQS SAELSSNSEQ GQSVPLNTST TTDPATTSTP 
PASVDTTATN TQTPAVTAPA PAVDPQQNAV VSPSQANVDT AATPAPTAAT TPDGAAPLPT 
DQAGVTTPVA DPNALVMNFT ADCWLEVTDA TGKKLFSGMQ RKDGNLNLTG QAPYKLKIGA 
PAAVQIQYQG KPVDLSRFIR TNQVARLTLN AEQSPAQ