Gene EcolC_3888 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3888
Symbol
ID	6064356
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	4265907
End bp	4267559
Gene Length	1653 bp
Protein Length	550 aa
Translation table	11
GC content	38%
IMG OID	641603302
Product	hypothetical protein
Protein accession	YP_001726817
Protein GI	170021863
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTAGCGC AGCTTTTTGA GCAGTTGTTT CAATCGATAG ACTCTACACT GATCACCAAT 
ATTTTCATCT GGGCTGTTAT ATTCGTATTT TTATCAGCGT GGTGGTGTGA CAAAAAAAAT 
ATACATAGTA AGTTTAGAGA ATATGCTCCA ACCTTAATGG GGGCATTAGG TATTCTGGGT 
ACTTTCATTG GTATTATTAT TGGTTTACTC AATTTTAATA CCGAAAGTAT TGATACCAGC 
ATCCCCGTAT TATTAGGTGG CCTAAAAACA GCATTCATTA CAAGCATTGT AGGTATGTTT 
TTTGCCATTT TATTTAATGG AATGGATGCT TTCTTTTTTG CCAATAAACG AAGTGCGTTA 
GCTGAAAATA ACCCTGAATC TGTTACACCT GAACATATCT ATCATGAATT AAAAGAGCAG 
AACCAGACTC TGACTAAATT AGTCTCGGGT ATTAACGGTG ATAGTGAAGG TTCTCTTATT 
GCTCAAATAA AATTACTACG TACTGAGATT AGCGATTCCT CGCAGGCACA ATTAGCTAAT 
CACACTCATT TCAGTAATAA GCTTTGGGAA CAACTTGAAC AATTTGCAGA TCTAATGGCA 
AAAGGTGCTA CAGAACAAAT TATTGATGCT TTGCGACAAG TCATTATTGA TTTTAATGAA 
AATTTAACTG AACAGTTTGG TGAAAACTTT AAAGCTCTTG ATGCCTCTGT AAAAAAACTT 
GTTGAGTGGC AGGGAAATTA TAAAACGCAA ATTGAGCAGA TGTCAGAACA ATATCAACAA 
AGTGTCGAGT CCCTGGTTGA AACAAAAACT GCGGTTGCAG GGATTTGGGA AGAATGTAAA 
GAAATTCCTC TGGCTATGTC TGAACTGCGT GAAGTGCTTC AGGTGAACCA ACATCAAATC 
AGCGAACTCT CCCGCCATTT AGAAACCTTT GTCGCCATCC GCGATAAAGC TACAACCGTA 
TTACCTGAAA TACAGAACAA AATGGCTGAA GTGGGTGAAC TGCTGAAATC CGGAGCTGCA 
AATGTTAGTG CATCTCTTGA GCAAACCAGC CAGCAAATAC TTCTTAATGC AGATTCAATG 
CGCGTTGCCC TGGATGAAGG TACCGAAGGA TTCAGACAAT CGGTTACCCA AACACAACAA 
GCATTTGCCT CGATGGCGCA TGATGTCAGC AATTCCTCCG AAACCCTAAC CAGCACGTTA 
GGTGAAACAA TTACTGAAAT GAAACAAAGT GGTGAAGAAT TCCTGAAATC ACTAGAGTCG 
CACTCGAAAG AATTGCATAG AAATATGGAA CAAAATACGA CGAATGTGAT TGATATGTTC 
AGTAAGACTG GTGAAAAGAT TAACCATCAA CTATCCAGTA ATGCCGATAA TATGTTTGAT 
TCAATCCAGA CATCATTTGA TAAGGCTGGT GCAGGGCTGA CTTCTCAAGT CAGAGAATCA 
ATTGAAAAAT TTGCTCTATC CATCAACGAG CAGTTACATG CTTTTGAGCA AGCAACTGAA 
CGTGAAATGA ACCGTGAAAT GCAATCATTA GGTAATGCTC TGCTTTCAAT CAGCAAAGGT 
TTTGTCGGTA ACTATGAAAA ACTTATTAAA GATTACCAAA TAGTTATGGG GCAGTTACAA 
GCATTAATTT CTGCTAATAA ACATCGAGGG TAA

Protein sequence

MLAQLFEQLF QSIDSTLITN IFIWAVIFVF LSAWWCDKKN IHSKFREYAP TLMGALGILG 
TFIGIIIGLL NFNTESIDTS IPVLLGGLKT AFITSIVGMF FAILFNGMDA FFFANKRSAL 
AENNPESVTP EHIYHELKEQ NQTLTKLVSG INGDSEGSLI AQIKLLRTEI SDSSQAQLAN 
HTHFSNKLWE QLEQFADLMA KGATEQIIDA LRQVIIDFNE NLTEQFGENF KALDASVKKL 
VEWQGNYKTQ IEQMSEQYQQ SVESLVETKT AVAGIWEECK EIPLAMSELR EVLQVNQHQI 
SELSRHLETF VAIRDKATTV LPEIQNKMAE VGELLKSGAA NVSASLEQTS QQILLNADSM 
RVALDEGTEG FRQSVTQTQQ AFASMAHDVS NSSETLTSTL GETITEMKQS GEEFLKSLES 
HSKELHRNME QNTTNVIDMF SKTGEKINHQ LSSNADNMFD SIQTSFDKAG AGLTSQVRES 
IEKFALSINE QLHAFEQATE REMNREMQSL GNALLSISKG FVGNYEKLIK DYQIVMGQLQ 
ALISANKHRG