Gene ECD_00833 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_00833
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	-
Start bp	880980
End bp	882746
Gene Length	1767 bp
Protein Length	588 aa
Translation table	11
GC content	57%
IMG OID
Product	Terminase, ATPase subunit
Protein accession	ACT42728
Protein GI	253977058
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACACCA CACTGACACC CGCAGATCTC GATCCCCGTC GGCAGGCCAT GCTGCTGTAC 
TTTCAGGGAT ACCGCGTAGC CCGCATTGCT GAAATGCTGG GCGAGAAAGT TGCAACCGTT 
CACAGCTGGA AAAAACGCGA CAAGTGGGGT GACTATGGGC CGCTGGATCA GATGCAGCTC 
ACCACCGCCG CACGCTACTG CCAGCTCATT ATGAAGGAGC ACAAAGAAGG GAAAGATTTC 
AAAGAGATTG ACCTGCTGGC GCGCCAGTCG GAGCGCCATG CGCGGATCGG CAAGTTTAAC 
AATGGCGGCA ACGAAGCCGA CTTAAACCCT AACGTCGCCA ACCGCAACAA AGGCCCGCGT 
CGTCAGCCGG AAAAGAACGT TTTCACCGAT GAACAGATTG AGAAGCTGGA AGAAATCTTC 
CATTCCTCCA TGTTCAACTA CCAGCGCCAC TGGTGGGAAG CCGGAAAAAC CAACCGCATC 
CGCAACCTGC TGAAGTCACG CCAGATCGGC GCGACCTTCT ATTTTGCCCG TGAAGCCCTG 
ATTGACGCCC TGCTAACCGG GCGTAACCAG ATTTTCCTTT CCGCCAGCAA GGCACAGGCC 
CACGTCTTTA AGCAGTACAT CATCGACTTC GCCAAAGAAG TGGAGGTGGA GCTGAAAGGC 
GATCCGATAG TGCTTCCTAA CGGGGCCACG CTGTACTTCC TCGGCACCAA TGCCCGCACG 
GCCCAGAGTT ACCACGGCAA CCTGTATCTG GATGAATATT TCTGGATACC GAAATTCCAA 
GAGCTGCGCA AAGTGGCTTC CGGTATGGCT ATTCACAAAA AATGGCGACA AACCTATTTT 
TCCACGCCAT CCAGCCTGAC ACACAGTGCT TATCCGTTCT GGTCCGGTGC GCTGTTCAAC 
CGTGGGCGCA ACAAAGCCGA CAAGGTGGAC ATCGACCTGT CCCACAGCAA TCTGGCCCCC 
GGCCTGCTGT GCACAGACGG GCAATACCGC CAGATAGTCA CCGTGGAAGA TGCGGTGCGC 
GGCGGCTGTA ACCTGTTCGA CCTCGACCAG CTACGCATGG AGTACAGCCC GGACGAATAC 
CAGAACCTGC TGATGTGCGA GTTCGTGGAC GATCTCGCGT CCGTGTTCCC GCTCAGCGAG 
CTGCAAGCGT GCATGGTGGA CAGTTGGGAA ATCTGGACCG ACTTTCATGC ACTGGCCCTG 
CGCCCGTTTG GCTGGCGCGA AGTGTGGATC GGTTATGACC CGGCAAAAGG TACGCAGAAC 
GGCGACAGTG CCGGATGCGT GGTGGTGGCA CCGCCAGCCG TGCCGGGTGG TAAGTTCCGC 
ATTCTTGAGC GTCACCAGTG GCGCGGGATG GACTTCCGCG CCCAGGCTGA CGCCATCAAA 
AAACTGACCG AGCAGTACAA CGTGACCTAC ATCGGCATCG ACTCGACAGG TGTCGGCCAC 
GGGGTTTACG AGAACGTGAA AGCGTTTTTT CCAGCCGTCC GGGAGTTTGT CTACAACCCC 
AACGTTAAAA ACGCCCTGGT ACTCAAGGCC TACGACATTA TCAGTCACCG TCGTCTGGAG 
TTTGACGCCG GACACACCGA CATAGCGCAG TCATTTATGG CAATCCGTCG CGCCACCACC 
GCCAGCGGCA ACCGCCCAAC CTATGAAGCC AGCCGCAGCG AAGAAGCCAG CCATGCCGAT 
CTGGCCTGGG CAACAATGCA CGCACTGTTT AACGAACCGC TGCAGGGCGA GTCCGCCAAT 
ACCAGCAATA TTGTGGAGAT TTTTTGA

Protein sequence

MNTTLTPADL DPRRQAMLLY FQGYRVARIA EMLGEKVATV HSWKKRDKWG DYGPLDQMQL 
TTAARYCQLI MKEHKEGKDF KEIDLLARQS ERHARIGKFN NGGNEADLNP NVANRNKGPR 
RQPEKNVFTD EQIEKLEEIF HSSMFNYQRH WWEAGKTNRI RNLLKSRQIG ATFYFAREAL 
IDALLTGRNQ IFLSASKAQA HVFKQYIIDF AKEVEVELKG DPIVLPNGAT LYFLGTNART 
AQSYHGNLYL DEYFWIPKFQ ELRKVASGMA IHKKWRQTYF STPSSLTHSA YPFWSGALFN 
RGRNKADKVD IDLSHSNLAP GLLCTDGQYR QIVTVEDAVR GGCNLFDLDQ LRMEYSPDEY 
QNLLMCEFVD DLASVFPLSE LQACMVDSWE IWTDFHALAL RPFGWREVWI GYDPAKGTQN 
GDSAGCVVVA PPAVPGGKFR ILERHQWRGM DFRAQADAIK KLTEQYNVTY IGIDSTGVGH 
GVYENVKAFF PAVREFVYNP NVKNALVLKA YDIISHRRLE FDAGHTDIAQ SFMAIRRATT 
ASGNRPTYEA SRSEEASHAD LAWATMHALF NEPLQGESAN TSNIVEIF