Gene ECD_03438 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_03438
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	+
Start bp	3615417
End bp	3617396
Gene Length	1980 bp
Protein Length	659 aa
Translation table	11
GC content	55%
IMG OID
Product	conserved hypothetical protein
Protein accession	ACT45237
Protein GI	253979567
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACATTT CGGAAGTCGA TCTGCGTAAA CTGACGGTCA GCGATCCGTT CCTCGGTCAG 
TACCAACAAC TGGTCCGCGA CGTGGTGATT TCTTATCAAT GGGATGCCTT GAACGATCGT 
ATCCCAGAAG CGGAACCCAG CCATGCGATT GAAAACTTTC GCATTGCTGC CGGACTTCAG 
GAGGGTGAAT TTTACGGGAT GGTGTTTCAG GACAGCGACG TCGCCAAATG GCTGGAAGCG 
GTAGCCTGGT CGCTGTGCCA GAAGCCGGAC GCCGAACTGG AAAAAACCGC CGACGAGGTA 
ATCGAACTGA TCGCCTCCGC CCAATGTGAA GACGGCTATC TCAATACTTA CTTTACGGTA 
AAAGCACCCG AAGAACGCTG GAGCAATCTT GCGGAGTGTC ATGAACTTTA CTGCGCCGGT 
CATCTGATTG AAGCCGGAGT CGCCTTCTTC CAGGCCACGG GAAAACGACG CTTGCTGGAG 
GTGGTTTGCC GTCTGGCCGA TCATATCGAC CGCGTATTTG GTCCAGATGA AAGTAAGTTA 
CACGGTTATC CTGGTCACCC GGAAATTGAA CTGGCACTAA TGCGCCTGTA TGAAGTGACT 
GAAGAGCCGC GCTACCTGGC GCTGACGAAC TATTTTGTCG AACAGCGTGG TGCGCAACCG 
CACTATTACG ACCAAGAATA TGAAAAGCGC GGGCAGACAT CGCACTGGCA CACCTACGGC 
CCGGCGTGGA TGGTGAAAGA CAAAGCCTAC AGCCAGGCAC ATTTGTCCCT TGCGCAACAG 
CAAACCGCCA TCGGTCACGC GGTACGTTTT GTCTACCTGA TGACCGGCGT CGCGCATCTC 
GCGCGTTTAA GTCACGATGA CAGCAAGCGT CAGGACTGCC TGAGGCTGTG GAACAATATG 
GCCCAGCGTC AGTTATATAT TACCGGCGGC ATTGGCTCGC AAAGCAGCGG CGAAGCGTTC 
ACTAGCGATT ACGATCTGCC GAATGACACG GTTTACGCCG AAAGTTGTGC TTCCATCGGC 
CTGATGATGT TCGCCCGGCG AATGCTGGAA ATGGAAGGCG ACAGTCAATA TGCCGATGTG 
ATGGAGCGCG CGCTGTACAA CACCGTGCTC GGCGGCATGG CGCTGGATGG CAAACATTTC 
TTCTATGTGA ATCCGCTGGA AGTACATCCA AAATCGCTGA AATTCAACCA TATCTACGAT 
CACGTTAAAC CGATCCGCCA GCGTTGGTTT GGCTGCGCTT GTTGTCCGCC AAATATCGCC 
CGCGTGCTGA CCTCGATTGG TCATTATCTC TACACGCCGC GTGAAGATGC GTTGTATATC 
AACATATACG CAGGAAACAG CATGGAAGTG CCGGTAGAAA ATGGCACGCT GCGCCTGCGG 
GTTAGCGGGA ACTATCCGTG GCAGGAGCAG GTGACGATTG CGGTTGAATC GCCCCAGCCG 
GTACGTCATA CGCTGGCTTT ACGTCTGCCG GACTGGTGCA CACAGCCGCA GATCATATTG 
AATGGGGAAG AGGTCGAGCA GGATATTCGT AAAGGGTATT TGCACATTAC CCGCGAATGG 
CAGGAGGGCG ATACGCTGAA TCTGACTTTG CCGATGCCGG TACGCCGCGT TTACGGTAAC 
CCGCTGGTGC GTCACGTCGC CGGAAAAGTG GCGATTCAGC GCGGCCCGCT GGTGTATTGC 
CTGGAACAGG CCGACAACGG CGAGTCACTG CATAATCTGT GGCTGCCCAC CGATGCGCCA 
TTTACGACAT TTGAAGGCAA GGGATTGTTT AGCCATAAGA TCTTAATCCA GGCACCGGGT 
TACCGGTATG AACAGAGCAA TCCAGAGCAG CAACCGCTGT GGCATTACGA CAGCGCGCCA 
GCCAAACGCC AGCCGCAAAC TCTGACGTTT ATCCCGTGGT TTAGCTGGGC TAACCGGGGC 
GAAGGCGAAA TGCGGATCTG GGTGAATGAG GAAAAGCATC GCCATCCGGA GGTTGGATAA

Protein sequence

MNISEVDLRK LTVSDPFLGQ YQQLVRDVVI SYQWDALNDR IPEAEPSHAI ENFRIAAGLQ 
EGEFYGMVFQ DSDVAKWLEA VAWSLCQKPD AELEKTADEV IELIASAQCE DGYLNTYFTV 
KAPEERWSNL AECHELYCAG HLIEAGVAFF QATGKRRLLE VVCRLADHID RVFGPDESKL 
HGYPGHPEIE LALMRLYEVT EEPRYLALTN YFVEQRGAQP HYYDQEYEKR GQTSHWHTYG 
PAWMVKDKAY SQAHLSLAQQ QTAIGHAVRF VYLMTGVAHL ARLSHDDSKR QDCLRLWNNM 
AQRQLYITGG IGSQSSGEAF TSDYDLPNDT VYAESCASIG LMMFARRMLE MEGDSQYADV 
MERALYNTVL GGMALDGKHF FYVNPLEVHP KSLKFNHIYD HVKPIRQRWF GCACCPPNIA 
RVLTSIGHYL YTPREDALYI NIYAGNSMEV PVENGTLRLR VSGNYPWQEQ VTIAVESPQP 
VRHTLALRLP DWCTQPQIIL NGEEVEQDIR KGYLHITREW QEGDTLNLTL PMPVRRVYGN 
PLVRHVAGKV AIQRGPLVYC LEQADNGESL HNLWLPTDAP FTTFEGKGLF SHKILIQAPG 
YRYEQSNPEQ QPLWHYDSAP AKRQPQTLTF IPWFSWANRG EGEMRIWVNE EKHRHPEVG