Gene EcE24377A_0993 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_0993
Symbol
ID	5588914
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	+
Start bp	1010333
End bp	1011418
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	55%
IMG OID	640924700
Product	hypothetical protein
Protein accession	YP_001462114
Protein GI	157157895
COG category	[S] Function unknown
COG ID	[COG5283] Phage-related tail protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.600478
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTAACA ATGTAAAATT ACAGGTATTG CTCAGGGCTG TTGACCAGGC ATCACGCCCG 
TTTAAATCCA TCCGTACAGC GAGCAAATCG CTGTCGGGGG ATATCCGGGA AACACAAAAA 
TCACTGCGCG AGCTGAACGG TCAGACATCC CGTATTGAGG GATTTCGCAA GACCAGTGCA 
CAGCTCGCCG TGACTGGTCA TGCACTTGAA AAGGCTCGGC AGGAAGCAGA AGCCCTTGCC 
ACACAGTTTA AAAACACCGA ACGTCCGACC CGTGCTCAGG CGAAAGTGCT GGAATCAGCA 
AAGCGAGCGG CGGAGGACTT ACAGGCGAAA TATAACCGCC TGACGGATTC CGTTAAACGC 
CAGCAGCGGG AACTGGCCGC TGTGGGAATT AATACCCGCA ATCTTGCACA TGATGAGCAG 
GGACTGAAAA ACCGTATCAG TGAAACCACC GCACAGCTTA ACCGGCAGCG CGACGCGCTG 
GCGCGTGTCA GTGCGCAACA GGCAAAACTT AACGCAGTCA AACAGCGTTA TCAGGCCGGA 
AAGGAACTGG CCGGAAATAT GGCCTCAGTA GGCGCTGCCG GTGTGGGGAT TGCGGCGGCG 
GGAACGATGA CCGGAGTTAA GTTGCTGATG CCCGGTTATG AGTTTGCGCA GAAAAACTCA 
GAATTGCAGG CCGTGCTCGG AGTGGCAAAA GACTCCGCCG AAATGACCGC ACTACGCAAA 
CAGGCGCGCC AGCTCGGCGA CAATACCGCC GCCTCGGCGG ATGATGCGGC CGGTGCACAG 
ATAATCATCG CGAAAGCGGG TGGAGATGCT GCGGCTATTC AGGCGGCAAC GCCGGTCACG 
CTGAATATGG CACTGGCGAA TCAGCGGTCG ATGGAAGAAA ACGCGCAACT GTTGCTGGGG 
ACTAAGGCAT CCTTTCAACT GTCAAATGAT GATGTCAGCC ATGTGGGCGA CGTGTTGTCG 
GCAACGATGA ATAAGTCGGC GGCTGATTTT CAGGGGCTCA GTGATGCACT GACTTACCTC 
GGGCCGGTTG CGAGGACGGC GGGTGTAAGT CTTGAGCATG TCAGCGCCAA TGATATAAGA 
CAGTAA

Protein sequence

MSNNVKLQVL LRAVDQASRP FKSIRTASKS LSGDIRETQK SLRELNGQTS RIEGFRKTSA 
QLAVTGHALE KARQEAEALA TQFKNTERPT RAQAKVLESA KRAAEDLQAK YNRLTDSVKR 
QQRELAAVGI NTRNLAHDEQ GLKNRISETT AQLNRQRDAL ARVSAQQAKL NAVKQRYQAG 
KELAGNMASV GAAGVGIAAA GTMTGVKLLM PGYEFAQKNS ELQAVLGVAK DSAEMTALRK 
QARQLGDNTA ASADDAAGAQ IIIAKAGGDA AAIQAATPVT LNMALANQRS MEENAQLLLG 
TKASFQLSND DVSHVGDVLS ATMNKSAADF QGLSDALTYL GPVARTAGVS LEHVSANDIR 
Q