Gene EcolC_2999 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2999
Symbol
ID	6065931
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	3278391
End bp	3279818
Gene Length	1428 bp
Protein Length	475 aa
Translation table	11
GC content	48%
IMG OID	641602416
Product	heat shock protein DnaJ domain-containing protein
Protein accession	YP_001725951
Protein GI	170020997
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAATT GCTGGAAGAT CCTCGATATA GAGGAAACGA CTGACGTCGA TATTATCCGC 
CGCGCTTATC TGGCGCTGTT ACCGTCCTTT CATCCAGAAA CCGATCCGCA GGGTTTTAAA 
CAACTTCGTC AGGCGTATGA GGAGGCGCTA CGGATTGCGC AGTCGCCTGC TAAATCTGTT 
TGGCAACCAG AAGAATATGA GGTAGCAGAA CATGAAATTC TGCTCGCCTT TCGTGCGTTA 
CTTGCCTCTG ATAGTGAACG TTTTCTGCCC TCCGCCTGGC AGCGATTCAT TCAGCAATTA 
AATTATTGCT CGATGGAGGA GATTGATGAA TTACGCTGGT CGCTGTGCAC AATCGCCATG 
AACACTGCCC ATTTATCCTT CGAGTGCGTG GTGTTATTAG CAGAAAGATT GCGGTGGTTA 
CAGGAGGAAA ATACCGGGGA AATAGACGAA GAAGAACTGG AATCCTTTTT ATATGCCATT 
GCGAAGGGGA ATGTTTTTAA CTTCCAGACC ATTCTGCATC TGCCCGTTGC CGTGCAAAAT 
GACACCATCG ATTTTTACCA AATGTTCGCT CGGATTTGGT CATCGCATCC AGAATGGCTG 
ACATTGTATT TAGCGCAACA TCGCGCAGTG ATTATCCCCG ATGATGCAAA ACTGCACAGA 
AATTTACTCC GCTGGTATAG CGCAGGTCGC CTGGATATCC CCGAACTTCT GGATTACGCC 
CAGTCATGGC GGGAAACTGA ACCTGATAAT GAAGATGCGC CTTATTATGA ATACGCGCAA 
CGCGTCTATT GTGGAGAAGG CGAAAGCCTG TTGGCAGAAC TTTGTGACTA CTGGCGCGAG 
TATCCCTCCA CCCAGGCGGA TGCTTTAATG TTGCAATGGT GCCGTCAGCA TCGGGTCGAT 
TATTACCCAT TACTGGTGAT GATGATTGAA GCGCGTGATC TGGTTAACGA TCAGGGAAAA 
CCGCTACTTT ATGTCCCCGG CGACAGCGCC CGTACGCGTT TTCATTTATA CGAAATACTC 
AGCGATGAAA AACTCTCTGC GCTGGGGCGT TCACTGGTCG AGATGGTTTT GCACAAAGGA 
CGTAAGCCGC GGCTCTCACT CACGCGTGAT ACAGAACATA CCTTATGGCC ATTATATCTA 
GTTGCCAAAC AATTAGTGCA GGCCTGCCAA CCTACAGAAG AATCATTAAT GCCGATTGTG 
AGCCGCCTTG ATGCAGAAAA TCGTTGTCCA CTGGAAGCAT TAATTATTCG TCGATTATTA 
ATTCAGGCGG CGAATTTTAC CGAGAAGCAA ACTGTTGAAC CGGAGCCGCA ACCGCAGCCA 
ATGCCCGTTG ACGATGGTGG GCCAGGCTGT CTGGGCATCA TTAAAATTAT TTTCTATATT 
TTTATCTTTG CTGGTTTGAT AGGGAAAATA CTCCATCTGT TCGGGTGA

Protein sequence

MKNCWKILDI EETTDVDIIR RAYLALLPSF HPETDPQGFK QLRQAYEEAL RIAQSPAKSV 
WQPEEYEVAE HEILLAFRAL LASDSERFLP SAWQRFIQQL NYCSMEEIDE LRWSLCTIAM 
NTAHLSFECV VLLAERLRWL QEENTGEIDE EELESFLYAI AKGNVFNFQT ILHLPVAVQN 
DTIDFYQMFA RIWSSHPEWL TLYLAQHRAV IIPDDAKLHR NLLRWYSAGR LDIPELLDYA 
QSWRETEPDN EDAPYYEYAQ RVYCGEGESL LAELCDYWRE YPSTQADALM LQWCRQHRVD 
YYPLLVMMIE ARDLVNDQGK PLLYVPGDSA RTRFHLYEIL SDEKLSALGR SLVEMVLHKG 
RKPRLSLTRD TEHTLWPLYL VAKQLVQACQ PTEESLMPIV SRLDAENRCP LEALIIRRLL 
IQAANFTEKQ TVEPEPQPQP MPVDDGGPGC LGIIKIIFYI FIFAGLIGKI LHLFG