Gene EcolC_2766 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2766
Symbol
ID	6064812
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	3036658
End bp	3038169
Gene Length	1512 bp
Protein Length	503 aa
Translation table	11
GC content	33%
IMG OID	641602172
Product	hypothetical protein
Protein accession	YP_001725721
Protein GI	170020767
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.405053
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.0000336411
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGCGCCCCA AAATTGGTGA TTTTGAATTT GGTGAGGTTT ATGGAGAGAA TGAGGTATTA 
TTTCTCGATA ATTACTCGAA ATATTTTTAT GATATAAATA ATTCATTAAG TAAACTTGAT 
AGAAAAAATA AAATGCTCGT AATTGGCAGG AAGGGGACGG GTAAGACATT GCTTGTTAAT 
GTCTACTGTA ACGCCAAGCG AAAAAATAAT TATATTGCAG TTGTGGAATC ATTAAAAGAT 
TTTGTTTTTC ATGAACTTAC TCACTTTCAG GGGCAGGATG TGTCTTCCAC AAAATATGTA 
CCAATTTTCA AGTGGATGAT ATTGGTCAAT CTTGCTAAGA ATATTGTAAG TAATAAAAAA 
GGATTTAGTG AGGATAAAAT AGTTCATTTG GAAAGTTTTT TACGTTCTTT TGGCCATGTC 
GCGGGCGAGT TAAGGCCTGA GCAAACAGTT GAAATAACTA GGGAGTACCA AGCGTCGGGT 
GAGGTTGGTA TCGGATTTAG ATTCCCAGTA TTACGTGGTG AAGCCAAAGC AAAAGATGGT 
GAGGTCGAGA AAACAAAAGA AACAAAAAAG AATTATTTGG AATGTATGGA ATCTTTGCAG 
TGTTTTATTG TTGACATGCT AAAAGAGAGT AATAAAAAAA TATATGTATT TTATGATGAG 
TTAGATGATA AGTTTGATGC AACAGTTGAA TATAAAAATG CAATGATAAG TTTTTTAAAT 
GCTGTTGTGT CAATTAATAA AACTCTAATG CAAAATAAAA TAGATGCTAA AATTGGTGCA 
GTTATTCGTC ATGATATAAT AAATACTTTT TCATCGCCGA ATATTAATAA AATCATTGAA 
GATAACTCTG TTACACTTGA TTGGTGTTCT GCTGGAGAAC GAGCAAGTGA TTCTGAGATT 
TTTGATATGA TTGCTTTTAA GATCAAAAAC TCCACTGATT ATTATAATGA TTTAAATGGT 
TCTAATTTGT TCGGGAAAAT TTTCACTGAG AGAGTTGCAG GTGAGCATAG CTCTATTTAT 
ATTTTACATA GAACTCTAGG TCGCCCAAGA GATGCCGTTA GGATGCTAAC TTATATTCAA 
GATGAATATG GAGAAAATAC TGAAAGATTT GAAAGTTCCA TGTTTACAAA GATTTCTAAA 
AAATACTCAT CTTATCTTTT ACGTGAAATT AGATCTGAGC TTGCGGGACA TTTAAGTGAT 
TCAGAAATAG ATGACAGTTT TTCTCTTTTA CGTTCATTAA AAAAAAGAGG TTTCACTCCA 
CATTTAATCA AGGAAAAATT TGAAGAATTG AAGTTAGGAG ATGGTACATT AACGCTTAAT 
AAAATACTGA GTTGTTTATT TAAAGTCGGT GCTATCGGGA ATGTACTCAG GAGATCTAAA 
ACAGATGGCG GAGATGTTTA TTTGTGGTCA TTTAATGATG AAGATTTAGA AATGGACCCA 
ACGTTGAATT TTGAAATACA CTGTGGTTTG TGGGATGCAC TAGGAATTAT CAAGCCTAAA 
CTTAGGCAAT AA

Protein sequence

MRPKIGDFEF GEVYGENEVL FLDNYSKYFY DINNSLSKLD RKNKMLVIGR KGTGKTLLVN 
VYCNAKRKNN YIAVVESLKD FVFHELTHFQ GQDVSSTKYV PIFKWMILVN LAKNIVSNKK 
GFSEDKIVHL ESFLRSFGHV AGELRPEQTV EITREYQASG EVGIGFRFPV LRGEAKAKDG 
EVEKTKETKK NYLECMESLQ CFIVDMLKES NKKIYVFYDE LDDKFDATVE YKNAMISFLN 
AVVSINKTLM QNKIDAKIGA VIRHDIINTF SSPNINKIIE DNSVTLDWCS AGERASDSEI 
FDMIAFKIKN STDYYNDLNG SNLFGKIFTE RVAGEHSSIY ILHRTLGRPR DAVRMLTYIQ 
DEYGENTERF ESSMFTKISK KYSSYLLREI RSELAGHLSD SEIDDSFSLL RSLKKRGFTP 
HLIKEKFEEL KLGDGTLTLN KILSCLFKVG AIGNVLRRSK TDGGDVYLWS FNDEDLEMDP 
TLNFEIHCGL WDALGIIKPK LRQ