Gene ECD_01752 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_01752
Symbol	yeaG
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	+
Start bp	1811411
End bp	1813219
Gene Length	1809 bp
Protein Length	602 aa
Translation table	11
GC content	50%
IMG OID
Product	conserved protein with nucleoside triphosphate hydrolase domain
Protein accession	ACT43606
Protein GI	253977936
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGATGGCTA TCGGTGAGCC TGTCATGGTC GATACAGCCC AGGAACCCAG ACTTTCTCGA 
CTCTTTTCTA ACCGGGTCAT TGCACGTTAT CCGGCGTTTG AAGAGTTTTA CGGCATGGAA 
GACGCGATTG AACAGATTGT CTCTTATCTG AAACACGCGG CTCAGGGGCT GGAAGAGAAG 
AAACAAATCC TGTATCTGCT GGGGCCTGTG GGTGGGGGTA AATCATCGCT TGCTGAGCGA 
CTGAAATCAT TAATGCAGCT CGTACCGATT TATGTATTGA GCGCGAACGG TGAGCGTAGC 
CCGGTCAACG ATCATCCGTT CTGTCTTTTC AATCCGCAGG AAGATGCGCA GATTCTGGAA 
AAAGAGTATG GCATTCCTCG CCGTTATCTC GGCACCATCA TGTCGCCGTG GGCGGCAAAA 
CGCCTGCATG AATTTGGTGG CGATATCACT AAGTTCCGGG TAGTGAAGGT CTGGCCGTCA 
ATTCTGCAAC AAATTGCTAT CGCCAAAACG GAACCCGGCG ATGAGAACAA CCAGGACATC 
TCCGCGCTGG TTGGGAAAGT CGATATTCGT AAACTCGAAC ACTACGCGCA GAATGACCCG 
GACGCCTACG GCTATTCCGG TGCGCTGTGC CGCGCCAACC AGGGGATCAT GGAATTCGTT 
GAGATGTTTA AAGCACCGAT TAAAGTGCTG CATCCCTTGT TAACCGCCAC TCAGGAAGGT 
AACTACAACG GGACGGAAGG TATCTCCGCC CTGCCGTTCA ACGGGATTAT TCTTGCCCAC 
TCGAACGAGT CCGAATGGGT CACTTTCCGT AATAACAAAA ACAACGAAGC CTTCCTCGAT 
CGTGTTTACA TCGTGAAGGT GCCGTATTGC TTGCGCATTT CCGAAGAGAT CAAAATCTAC 
GAGAAATTGC TTAATCACAG TGAATTGACT CACGCCCCAT GCGCCCCTGG CACGCTCGAA 
ACACTGTCAC GTTTTTCCAT TCTTTCGCGC CTGAAAGAGC CAGAAAACTC CAGCATTTAT 
TCAAAGATGC GGGTTTATGA TGGCGAAAGT CTGAAAGACA CCGATCCCAA AGCCAAGTCG 
TATCAGGAAT ATCGTGACTA CGCCGGTGTC GATGAAGGGA TGAACGGTCT GTCGACGCGT 
TTTGCGTTTA AGATCCTCTC CCGCGTGTTC AACTTCGATC ATGTAGAAGT GGCAGCAAAC 
CCGGTCCATC TGTTCTACGT CCTGGAACAG CAGATTGAGC GCGAGCAGTT CCCACAAGAG 
CAGGCAGAAC GCTATCTGGA GTTCCTGAAA GGTTATCTGA TCCCGAAATA TGCCGAGTTT 
ATCGGCAAAG AGATCCAGAC GGCCTACCTT GAATCCTATT CCGAATATGG GCAAAACATT 
TTCGACCGTT ATGTTACCTA CGCGGATTTC TGGATTCAGG ATCAGGAGTA TCGCGATCCG 
GATACCGGGC AGCTGTTTGA CCGCGAGTCT CTTAACGCCG AGCTGGAGAA AATCGAGAAA 
CCGGCGGGGA TCAGTAATCC AAAAGATTTC CGCAACGAGA TTGTTAACTT CGTACTGCGC 
GCCAGAGCGA ATAACAGCGG ACGCAATCCG AACTGGACCA GCTATGAAAA ACTGCGCACG 
GTCATCGAGA AGAAAATGTT CTCCAATACC GAGGAGCTGT TGCCGGTTAT CTCGTTTAAC 
GCCAAAACGT CAACCGACGA GCAGAAGAAA CACGACGACT TTGTCGACCG TATGATGGAA 
AAAGGCTACA CCCGTAAACA GGTGCGTTTA CTGTGCGAAT GGTATTTGCG CGTACGTAAA 
TCGTCTTAA

Protein sequence

MMAIGEPVMV DTAQEPRLSR LFSNRVIARY PAFEEFYGME DAIEQIVSYL KHAAQGLEEK 
KQILYLLGPV GGGKSSLAER LKSLMQLVPI YVLSANGERS PVNDHPFCLF NPQEDAQILE 
KEYGIPRRYL GTIMSPWAAK RLHEFGGDIT KFRVVKVWPS ILQQIAIAKT EPGDENNQDI 
SALVGKVDIR KLEHYAQNDP DAYGYSGALC RANQGIMEFV EMFKAPIKVL HPLLTATQEG 
NYNGTEGISA LPFNGIILAH SNESEWVTFR NNKNNEAFLD RVYIVKVPYC LRISEEIKIY 
EKLLNHSELT HAPCAPGTLE TLSRFSILSR LKEPENSSIY SKMRVYDGES LKDTDPKAKS 
YQEYRDYAGV DEGMNGLSTR FAFKILSRVF NFDHVEVAAN PVHLFYVLEQ QIEREQFPQE 
QAERYLEFLK GYLIPKYAEF IGKEIQTAYL ESYSEYGQNI FDRYVTYADF WIQDQEYRDP 
DTGQLFDRES LNAELEKIEK PAGISNPKDF RNEIVNFVLR ARANNSGRNP NWTSYEKLRT 
VIEKKMFSNT EELLPVISFN AKTSTDEQKK HDDFVDRMME KGYTRKQVRL LCEWYLRVRK 
SS