Gene EcolC_3890 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3890
Symbol
ID	6064358
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	4268277
End bp	4269380
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	39%
IMG OID	641603304
Product	hypothetical protein
Protein accession	YP_001726819
Protein GI	170021865
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATTAT CTATCGACAT TTCAGAACTT ATTCAATTAG GGAAGAAAAT GTTACCAGAA 
GGAGTCGATT TTTTTCTGGA TGAATCCCCT ATTGACTTTG ATCCTATAGA TATTGAGTTA 
TCCACGGGTA AAGAAGTTAG TATCGAAGAT CTTGACCCTG GTAGCGGGCT TATCTCTTAT 
CATGGCCGCC AGGTTCTTTT ATATATTCGG GACCATTCAG GGCGTTATGA TGCGGCTATC 
GTAGATGGCG AAAAAGGAAA ACGTTTTCAT ATTGCCTGGT GCAGAACTCT TGATGAAATG 
CGCCATAAAA ATCGATTTGA AAGGTATCAT GCAACTAACC GCATAGATGG TTTATTCGAA 
ATTGATGATG GTTCAGGTCG GAGCCAGGAT GTTGATTTAC GGGTATGTAT GAATTGCCTC 
GAACGACTTA ATTATAAAGG AAGTATTGAT AAACAACGAA AAAGAGAGAT TTTTAAATCA 
TTCTCATTAA ATGAGTTTTT TTCAGATTAT AGTACCTGTT TTCGTCATAT GCCTAAGGGT 
ATCTATGACA AAACAAATAG TGGGTATGTC GAAAACTGGA AGGAAATATC TAAAGAAATA 
CGAGAAAAGG CAAATTATGT TTGTAATGAT TGTGGCGTGA ATTTATCAAC CGCCAAAAAC 
TTGTGCCATG TCCATCATAA AAATGGCATC AAATATGATA ATCACCATGA AAACCTTCTT 
GTTCTGTGCA AGGATTGCCA TCGAAAACAG CCCCTCCACG AAGGTATATT CGTTACCCAA 
GCAGAGATGG CTATCATTCA ACGTTTACGT TCCCAACAAG GGTTATTAAA AGCAGAATCC 
TGGAATGAAA TATATGACCT GACTGATCCA TCAGTGCATG GTGATATTAA TATGATGCAA 
CATAAAGGCT TTCAACCTCC TGTTCCTGGG TTAGATCTTC AAAACTCAGA ACATGAAATT 
ATTGCAACCG TAGAAGCTGC ATGGCCAGGC CTTAAAATTG CAGTTAACCT TACTCCCGCC 
GAAGTCGAAG GATGGAGAAT ATATACCGTG GGTGAGCTGG TTAAAGAAAT ACAAACCGGA 
GCCTTTACGC CAGCAAAATT GTAA

Protein sequence

MKLSIDISEL IQLGKKMLPE GVDFFLDESP IDFDPIDIEL STGKEVSIED LDPGSGLISY 
HGRQVLLYIR DHSGRYDAAI VDGEKGKRFH IAWCRTLDEM RHKNRFERYH ATNRIDGLFE 
IDDGSGRSQD VDLRVCMNCL ERLNYKGSID KQRKREIFKS FSLNEFFSDY STCFRHMPKG 
IYDKTNSGYV ENWKEISKEI REKANYVCND CGVNLSTAKN LCHVHHKNGI KYDNHHENLL 
VLCKDCHRKQ PLHEGIFVTQ AEMAIIQRLR SQQGLLKAES WNEIYDLTDP SVHGDINMMQ 
HKGFQPPVPG LDLQNSEHEI IATVEAAWPG LKIAVNLTPA EVEGWRIYTV GELVKEIQTG 
AFTPAKL