Gene EcolC_2247 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2247
Symbol
ID	6066948
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	2469142
End bp	2470458
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	50%
IMG OID	641601652
Product	putative dual specificity phosphatase
Protein accession	YP_001725211
Protein GI	170020257
COG category	[T] Signal transduction mechanisms
COG ID	[COG2453] Predicted protein-tyrosine phosphatase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATAACTG AACGTCGGAA CGTATTGCTA CAAGGCGCTG GCTGGTTATT GTTGCTGGCC 
CCGTTTTTCT TCTTCACCTA TGGATCTCTT AATCAGTTCA CCGCGGTTCA GGACCTTAAC 
AGCCATGATA TTCCCAGTCA GGTATTCGGT TGGGAAACGG CGATCCCTTT TCTTCCCTGG 
ACTATTGTTC CTTACTGGAG TCTGGATCTT TTATATGGAT TTTCGCTGTT CGTTTGTAGC 
ACGACATTCG AACAGCGCCG ACTTGTCCAC CGGCTTATTC TGGCAACGGT AATGGCCTGC 
TGCGGTTTTT TTCTCTACCC GCTGAAGTTT AGTTTTATCC GTCCTGAAGT GAGTGGGGTG 
ACAGGATGGC TATTTTCGCA ACTTGAACTG TTTGATCTGC CTTATAACCA GTCTCCTTCG 
CTGCATATTA TTCTCTGCTG GCTACTTTGG CGTCACTTTC GTCAGCATCT GGCTGTGAGG 
TGGCGTAAAG TCTGCGGCGG ATGGTTTTTA CTCATCGCCA TTTCGACGCT GACGACCTGG 
CAGCATCATT TTATTGATGT CATCACGGGG CTGGCGGTAG GTATGTTAAT TGACTGGATG 
GTGCCCGTCG ACCGTCGTTG GAATTATCAG AAACCTGATC AACGTCGAAT CAAAATAGCA 
CTGCCATATG TCGTAGGCGC GGGCTCGTGC ATTGTGTTGA TGGAGCTAAT GATAATGCTT 
CAGTTATGGT GGTCAGTCTG GTTATGTTGG CCAGTATTAT CGCTATTCAT CATTGGCCGT 
GGGTACGGTG GGCTTGGCGC GATAACAACA GGGAAAGATA GTCAGGGGAA ACTCCCGCCC 
GCCGTTTACT GGCTGACATT GCCCTGGCGT ATCGGGATGT GGCTGTCTAT GCGTTGGTCT 
TGTCTTCGCC TGGAGCCGGT GAGCAAAATT ACTGCTGGTG TTTATTTAGG GGCGTTTCCA 
CGACATATTC CGGCACAGAA TGCGGTTCTG GACGTCACCT TTGAATTCCC TCGCGGACGA 
GCCACAAAAG ATCGACTCTA TTTTTGTGTA CCGATGCTGG ATCTGGTGGT TCCGGAAGAG 
GGGGAGCTCC GACAGGCCGT GGCGATGCTG GAAACATTAC GCGAAGAGCA AGGCAGCGTT 
CTGGTCCATT GTGCATTGGG ATTATCGCGC AGTGCGCTGG TGGTGGCGGC ATGGTTGTTA 
TGTTACGGAC ACTGTAAAAC CGTTAATGAA GCGATTAGCT ATATTCGAGC CAGACGCCCG 
CAGATTGTGC TGACAGACGA GCACAAAGCG ATGCTGAGAT TATGGGAAAA CAGGTAA

Protein sequence

MITERRNVLL QGAGWLLLLA PFFFFTYGSL NQFTAVQDLN SHDIPSQVFG WETAIPFLPW 
TIVPYWSLDL LYGFSLFVCS TTFEQRRLVH RLILATVMAC CGFFLYPLKF SFIRPEVSGV 
TGWLFSQLEL FDLPYNQSPS LHIILCWLLW RHFRQHLAVR WRKVCGGWFL LIAISTLTTW 
QHHFIDVITG LAVGMLIDWM VPVDRRWNYQ KPDQRRIKIA LPYVVGAGSC IVLMELMIML 
QLWWSVWLCW PVLSLFIIGR GYGGLGAITT GKDSQGKLPP AVYWLTLPWR IGMWLSMRWS 
CLRLEPVSKI TAGVYLGAFP RHIPAQNAVL DVTFEFPRGR ATKDRLYFCV PMLDLVVPEE 
GELRQAVAML ETLREEQGSV LVHCALGLSR SALVVAAWLL CYGHCKTVNE AISYIRARRP 
QIVLTDEHKA MLRLWENR