Gene Ent638_2239 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_2239
Symbol
ID	5111220
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009436
Strand	-
Start bp	2428501
End bp	2430159
Gene Length	1659 bp
Protein Length	552 aa
Translation table	11
GC content	56%
IMG OID	640492423
Product	phage terminase
Protein accession	YP_001176962
Protein GI	146311888
COG category	[R] General function prediction only
COG ID	[COG4626] Phage terminase-like protein, large subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.478973
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCACAGT GGACAACAGC ATGCCCCGAC TGGGAATCCC TCCTGGTCGC AGGGGCGTCC 
ATTATTACGC CTCCGATCTT CCCTGACCAG GCAGAGCAGG CGCTGGGTAT TTTCCGGGAA 
CTGCGTGTTT CCGACCTCCC GGGCAAACCC ACGTTCGGTG AGTGTTCTGA GGCCTGGGTG 
TTTGACTTCG TGAAAGCCAT TTTCGGCGGT TATGAGGCTG ATACGGGAAA CCAGCTGATC 
CGGGAATATG GTTTGCTGAT TTCCAAGAAG AACACCAAAT CGACCATCGC GGCGGGCATT 
ATGCTGACCG CGCTGATCTT GTGCTGGCGT GAGGACGAGG AGCACCTGAT CCTGGCACCA 
ACCAAGGAGG TCGCCGATAA CAGCTTTAAG CCTGCCGCCG GCATGATCCG CGCCGACGAA 
GAATTGACCG ATATGTTCCA GATACAGGAT CATATTCGCA CCATTACCCA CCGGGTGACG 
CGCAATACAT TAAAAGTTGT GGCTGCGGAT ACCGACACCG TGTCCGGTAA GAAGTCCGGT 
CGCATCCTCG TGGATGAACT CTGGTTGTTC GGTAAGCGGG CGAACGCGGA AGCCATGTTT 
ATGGAAGCGC TTGGCGGGCA GGTATCACGT AATGAAGGAT GGGTGATCTA CCTCACAACG 
CAAAGTGATG AACCACCGGC GGGCGTGTTT AAAGAACGTC TAGATTACTG GCGCAATGTG 
CGCGACGGCA AAATCATCGA TCCGAAAACG CTGGGCATTC TTTATGAGTT CCCGGAGAGC 
ATGATCGATA GTAAGGCCTA TCTTGCACCT GAAAATTTCT ATATCACCAA CCCGAACATC 
GGCCTGTCTG TCAGCCCCGA ATGGATAGCC GACAATCTCC GCAAGAATCA GGCAAAAACT 
GATGGCACGC TGCAGCAGTT TCTGGCGAAG CACCTCAACA TTGAGATCGG CCTGAACCTG 
CGAACCGACC GCTGGGCGGG TGTCGATTTC TGGGAGCAGC AGGCGCAGCG CGTAAGTTTT 
GAAGATTTAC TGCGGCGCGC CGAGGTCATC ACTGTCGGGA TAGACGGCGG GGGGCTTGAT 
GATCTGCTGG GCTTTTCAGC TATCGGACGT GACGCGGATA CGCGTGAATG GCTGTGCTGG 
TGTCATGCCT GGGCGCATGA AATAGCGATC AGGCGTCGCA AAAGTGAAGA GTCAAGATTC 
AACGATTTCG TGAAGGCCGG CGACCTTACC ATTGTGAAGC GTGTCGGTCA GGATACCGAA 
GAAGTAGCGG AATATGTCAG CCGGATCCAC GTCGCGGAGC TGCTGGACAA GATAGGCATT 
GACCCCTCAG GGGTCGGACA AATCCTTGAC GCGCTGATTG AGGCGGACAT TCCCGCCGAT 
GCGGTGGTCG GCGTGAGTCA GGGCTGGCGC CTTGGTGGTG CGATCAAAAC CACAGAGCGC 
AAGCTTGCCG AGGGGGTGCT GATCCATGCC GGACAGCCAC TGATGGCATG GTGCGTGGGT 
AATGCCAGGG TTGAACCGAA GGGCAACGCC ATTCTCATCA CCAAACAGGC CAGCGGCAAG 
GGCAAGATTG ACCCGCTTAT GGCGCTGTTC AACGCGGTAT CGCTGATGGC CCTTAACCCT 
GAGGCGAAAA AACAGGACTA CCAGGTACTT TTCATATGA

Protein sequence

MAQWTTACPD WESLLVAGAS IITPPIFPDQ AEQALGIFRE LRVSDLPGKP TFGECSEAWV 
FDFVKAIFGG YEADTGNQLI REYGLLISKK NTKSTIAAGI MLTALILCWR EDEEHLILAP 
TKEVADNSFK PAAGMIRADE ELTDMFQIQD HIRTITHRVT RNTLKVVAAD TDTVSGKKSG 
RILVDELWLF GKRANAEAMF MEALGGQVSR NEGWVIYLTT QSDEPPAGVF KERLDYWRNV 
RDGKIIDPKT LGILYEFPES MIDSKAYLAP ENFYITNPNI GLSVSPEWIA DNLRKNQAKT 
DGTLQQFLAK HLNIEIGLNL RTDRWAGVDF WEQQAQRVSF EDLLRRAEVI TVGIDGGGLD 
DLLGFSAIGR DADTREWLCW CHAWAHEIAI RRRKSEESRF NDFVKAGDLT IVKRVGQDTE 
EVAEYVSRIH VAELLDKIGI DPSGVGQILD ALIEADIPAD AVVGVSQGWR LGGAIKTTER 
KLAEGVLIHA GQPLMAWCVG NARVEPKGNA ILITKQASGK GKIDPLMALF NAVSLMALNP 
EAKKQDYQVL FI