Gene ECD_01966 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_01966
Symbol	wzc
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	-
Start bp	2032497
End bp	2034659
Gene Length	2163 bp
Protein Length	720 aa
Translation table	11
GC content	53%
IMG OID
Product	protein-tyrosine kinase
Protein accession	ACT43817
Protein GI	253978147
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAGAAA AAGTAAAACA ACATGCCGCT CCGGTAACGG GCAGTGATGA AATCGATATT 
GGTCGCCTGG TCGGCACCGT CATTGAAGCG CGCTGGTGGG TGATTGGCAT CACCGCTGTA 
TTTGCCCTCT GTGCCGTGGT TTACACCTTC TTCGCCACGC CGATTTATAG TGCCGACGCA 
CTGGTACAAA TCGAGCAAAA CAGCGGCAAT TCGTTAGTGC AGGACATTGG TTCGGCATTA 
GCCAACAAAC CGCCTGCATC GGACGCCGAG ATCCAGTTGA TTCGTTCGCG TCTGGTGCTT 
GGTAAAACGG TGGACGATCT CGACCTCGAT ATTGCAGTGA GCAAAAACAC GTTCCCGATT 
TTCGGGGCGG GCTGGGATCG ACTGATGGGA CGCCAGAACG AGACGGTGAA AGTGACTACC 
TTTAACCGCC CGAAAGAGAT GGCGGACCAG GTGTTTACGC TTAATGTGCT GGACAATAAA 
AACTACACCC TGAGCAGTGA TGGCGGCTTT AGCGCCCGTG GGCAAGCGGG CCAGATGCTG 
AAAAAAGAAG GCGTCACGCT GATGGTTGAA GCCATTCACG CCCGCCCGGG CAGTGAGTTT 
ACCGTCACCA AATACTCCAC GTTGGGGATG ATCAACCAAC TGCAAAACAG CCTGACGGTA 
ACGGAGAACG GCAAAGACGC AGGCGTACTG AGCCTGACTT ATACCGGTGA AGATCGCGAA 
CAGATCCGCG ACATTCTTAA CAGCATCGCC CGTAACTATC AGGAACAAAA TATTGAGCGC 
AAATCGGCGG AAGCGTCGAA AAGCCTCGCT TTCCTCGCGC AACAGTTACC GGAAGTACGT 
AGCCGCCTCG ATGTTGCCGA AAACAAACTG AATGCCTTCC GTCAGGATAA AGATTCTGTT 
GATCTTCCGC TGGAAGCGAA AGCGGTGCTC GATTCGATGG TGAACATCGA CGCCCAGTTG 
AACGAACTGA CCTTTAAAGA GGCGGAAATC TCCAAGCTGT ACACCAAAGT TCACCCGGCG 
TACCGCACGC TGCTGGAGAA ACGTCAGGCG CTGGAAGACG AAAAAGCCAA ACTTAACGGT 
CGCGTAACGG CGATGCCGAA AACCCAGCAG GAGATTGTCC GTCTGACCCG CGATGTCGAG 
TCTGGTCAGC AGGTCTATAT GCAACTGCTG AATAAAGAGC AGGAGCTGAA AATCACCGAA 
GCCAGCACCG TCGGCGATGT GCGCATTGTT GACCCGGCAA TCACTCAGCC TGGTGTGCTA 
AAACCGAAGA AAGGGCTGAT TATCCTTGGG GCGATTATTC TTGGCCTGAT GCTCTCTATC 
GTGGGTGTGC TGCTGCGCTC GTTGTTTAAT CGCGGCATCG AAAGCCCGCA GGTGCTGGAA 
GAACACGGTA TCAGCGTCTA TGCCAGCATC CCGTTGTCGG AATGGCAGAA AGCGCGCGAT 
AGCGTCAAAA CCATCAAAGG GATTAAACGC TATAAACAGA GCCAGCTACT GGCGGTGGGG 
AATCCAACCG ATCTGGCGAT TGAAGCCATC CGCAGTCTGC GTACCAGCCT GCACTTCGCG 
ATGATGCAGG CGCAGAACAA TGTGTTGATG ATGACCGGGG TTAGCCCGTC AATCGGTAAA 
ACCTTTGTCT GCGCCAACCT GGCGGCGGTG ATCAGCCAGA CCAATAAACG CGTGTTGTTG 
ATCGACTGCG ATATGCGCAA AGGCTACACC CACGAGCTGT TGGGCACCAA TAACGTCAAT 
GGCCTGTCGG AAATTCTGAT TGGTCAGGGC GATATTACTA CCGCAGCTAA ATCGACCTCT 
ATTGCCAAAT TTGACCTGAT CCCGCGCGGT CAGGTGCCGC CAAATCCTTC TGAACTGTTG 
ATGAGCGAAC GCTTTGCCGA ACTGGTGAAC TGGGCGAGTA AAAACTATGA CCTGGTGTTG 
ATTGATACGC CGCCGATTCT GGCAGTGACC GATGCGGCAA TTGTTGGTCG TCATGTCGGA 
ACCACGTTAA TGGTGGCGCG TTATGCGGTC AACACATTGA AAGAAGTGGA AACCAGTCTG 
AGCCGCTTTG AGCAAAACGG TATTCCGGTG AAAGGGGTGA TTCTGAACTC CATCTTCCGC 
CGCGCCAGCG CGTATCAGGA TTATGGCTAT TACGAATACG AATATAAGTC GGATGCGAAA 
TAA

Protein sequence

MTEKVKQHAA PVTGSDEIDI GRLVGTVIEA RWWVIGITAV FALCAVVYTF FATPIYSADA 
LVQIEQNSGN SLVQDIGSAL ANKPPASDAE IQLIRSRLVL GKTVDDLDLD IAVSKNTFPI 
FGAGWDRLMG RQNETVKVTT FNRPKEMADQ VFTLNVLDNK NYTLSSDGGF SARGQAGQML 
KKEGVTLMVE AIHARPGSEF TVTKYSTLGM INQLQNSLTV TENGKDAGVL SLTYTGEDRE 
QIRDILNSIA RNYQEQNIER KSAEASKSLA FLAQQLPEVR SRLDVAENKL NAFRQDKDSV 
DLPLEAKAVL DSMVNIDAQL NELTFKEAEI SKLYTKVHPA YRTLLEKRQA LEDEKAKLNG 
RVTAMPKTQQ EIVRLTRDVE SGQQVYMQLL NKEQELKITE ASTVGDVRIV DPAITQPGVL 
KPKKGLIILG AIILGLMLSI VGVLLRSLFN RGIESPQVLE EHGISVYASI PLSEWQKARD 
SVKTIKGIKR YKQSQLLAVG NPTDLAIEAI RSLRTSLHFA MMQAQNNVLM MTGVSPSIGK 
TFVCANLAAV ISQTNKRVLL IDCDMRKGYT HELLGTNNVN GLSEILIGQG DITTAAKSTS 
IAKFDLIPRG QVPPNPSELL MSERFAELVN WASKNYDLVL IDTPPILAVT DAAIVGRHVG 
TTLMVARYAV NTLKEVETSL SRFEQNGIPV KGVILNSIFR RASAYQDYGY YEYEYKSDAK