Gene Ent638_3478 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_3478
Symbol
ID	5112983
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009436
Strand	-
Start bp	3785559
End bp	3787988
Gene Length	2430 bp
Protein Length	809 aa
Translation table	11
GC content	59%
IMG OID	640493683
Product	TP901 family phage tail tape measure protein
Protein accession	YP_001178188
Protein GI	146313114
COG category	[S] Function unknown
COG ID	[COG5283] Phage-related tail protein
TIGRFAM ID	[TIGR01760] phage tail tape measure protein, TP901 family, core region

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.790573
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.139413
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAATA ACGTCAGACT TGAGGTGCTG CTGAACGCAG TCGACCGGGC AAGCCGACCA 
CTTAAAGCTA TCCAGACCGC CAGCAAATCC CTGTCGGGCG ATATCCGCAC TTCACAGAAA 
TCCCTGCGCG AGCTCAATGC GCAGGCGTCA CGCATTGACG GATTTCGTAA AGCCAGCGCG 
CAGCTTGCCG TGACCGGCCA GTCGCTTGAG AAAGCAAAGC TTGAAGCGCA AGCCCTTGCC 
ACGCAGTTTA AAAATACCGA GCGCCCGACG CGCGCACAGG CGCAGGTGCT TGAATCCGCG 
AAGCGTGCCG CCGAGGGGTT GCAGACCAAA TATAACAGCC TGACAGAGTC CATTAAGCGC 
CAGCAACGCG AGCTCGGGGC AGCGGGGATT AATACGCGCA ATCTGGCGAA TGATGAGCGG 
GGGCTAAAAT CGCGCATCAG CGAGACAACC GCGCAGCTTA ACCGCCAGCG TGAGGCACTG 
GCGAAAGTCA GCGCTCAACA GGCCAGACTT AGCCAGGTAA AAGACCGATA TCAGGCCGGT 
AAATCTCTTG CGGGAAGCAT GGCGGGAGCG GGGGCTGCCG GGGTCGGTAT TGCGACAACG 
GGAACCGTGG CCGGGGTAAA ACTGATGATG CCGGGCTTTG ACTTTGCGCA GAAAAATTCC 
GAGCTGCAGG CTGTGCTCGG CGTCGAAAAA CAGTCGCCCG AAATGCAGGC GCTGCGTAAA 
CAGGCGCGAC AGCTCGGTGA CAACACCGCC GCCTCTGCTG ACGATGCGGC CGGTGCGCAA 
ATTATCATTG CCAAAAGCGG TGGCGATGCG GCGGCCATTC AGGCGGCGAC GCCGGTCACG 
CTGAATATGG CGCTGTCCAA CAAGCGCACG ATGGAGGAGA ACGCCGCGCT GCTGACGGGA 
ATGAAATCCG CGTTTCAGCT TTCCAACGAC AAAGTCGCGC ATATTGGCGA TGTGCTGTCG 
ATGACGATGA ACAAAACCGC TGCTGACTTT GACGGGATGA GCGACGCGCT GACCTATGCC 
GCGCCGGTCG CAAAAAATGC CGGGGTGAGT ATCGAAGAAA CTGCCGCGAT GGTCGGTGCG 
CTGCACGATT CTAAAATCAC CGGCTCGATG GCGGGAACGG GGAGCCGTGC AGTGCTGAGT 
CGCCTGCAGG CTCCGACCGG TAAAGCGTAT GACGCAATCA AAGAGCTCGG GATTAAAACG 
TCTGACAGTA AGGGAAACAC GCGCCCGATA TTTTCCATCC TGAAAGAAAT GCAGCGCAGT 
TTTGAGAAAA ACAACCTCGG CACTGGCCAG AAAGCCGAAT ACATGAAAAC CATTTTCGGA 
GAGGAGGCCA GCTCGGCGGC AGCGGTGCTG ATGGCCGCAG CCTCAAGCGG CAAGCTTGAC 
CAGCTCACCG CTGCGTTTAA AGCCTCGGAC GGCAAAACCG AGGAGCTGGT TAAGGTCATG 
CAGGACAACC TCGGCGGCGA CTTTAAAGAA TTTCAGTCAG CCTATGAGGC GGTCGGGACT 
GACCTGTTTG ACCAGCAAGA GGGCTCACTG CGTAAGCTGA CACAGACGGC GACGCAGTAT 
GTTTTAAAAA TTGACGGCTG GATTACCAAA AACAAAGGAC TGGCGACCAC TATCGGCGTG 
GTGGTGGGGG GAGCGCTAGC GCTCATTGGC GTGATGGGCG GGATTGGCCT TGTCGCGTGG 
CCGGTGGTGA TGGGGATTAA TGCCATTATC GCCGCTGCTG GCGTGCTGGG TGTGGTATTC 
AGCTCGGTCG GCACTGCCAT TGGTGCAATC AGTCTGCCGG TGGTGGCCGT GGTCGCGGCT 
GTGGTGGCGG GTGCGCTGCT CATTCGCAAA TACTGGGAGC CGATTAGTGC CTTTTTCTCG 
GGCGTGGTGG AGGGGCTTAA AGCCGCTTTC GCGCCGGTCG GAGAAATGTT TGCACCGCTC 
GCGCCGGTGT TTGACTCCAT CGCGGAAAAG CTCGGTGTGG TCTGGAAATG GTTTACTGAC 
CTGCTTGCGC CGGTGAAAGC CACGCAGGAG ACGCTCGACC GCTGCAAAAA TGTCGGCGTG 
GCCTTTGGTC AGGCGCTGGC TGATGCGCTG ATGGCTCCGC TCAACATCTT TAACAGTCTG 
AGCGGAAAGG TGAGCTGGTT GCTGGAAAAA CTCGGGGTTA TCAAAAAGGA ATCCAGCGAC 
CTCGACCAGA ACGCCGCGAA AACGGACAAG ACCGCCGCAA ATGGCGGGTA TATCCCGGCA 
ACAGCGGCCT ATGGCGGCTA TCAGAGTTAT CAACCTGTCA CGGCTCCCGC AGGGCGCTCG 
TATATCGACC AGAGCAAAAG CGAGTACAAC ATCACCCTGC AGGGCGGGGT CGCGGCGGGG 
AGTGACCTCG ACCGCCAGCT CCGCGACGCC GTCGACAAGC TCGACCGCGA AAAACGTGCG 
CGCCAGCGCT CCAGCATGAG ACACGATTGA

Protein sequence

MSNNVRLEVL LNAVDRASRP LKAIQTASKS LSGDIRTSQK SLRELNAQAS RIDGFRKASA 
QLAVTGQSLE KAKLEAQALA TQFKNTERPT RAQAQVLESA KRAAEGLQTK YNSLTESIKR 
QQRELGAAGI NTRNLANDER GLKSRISETT AQLNRQREAL AKVSAQQARL SQVKDRYQAG 
KSLAGSMAGA GAAGVGIATT GTVAGVKLMM PGFDFAQKNS ELQAVLGVEK QSPEMQALRK 
QARQLGDNTA ASADDAAGAQ IIIAKSGGDA AAIQAATPVT LNMALSNKRT MEENAALLTG 
MKSAFQLSND KVAHIGDVLS MTMNKTAADF DGMSDALTYA APVAKNAGVS IEETAAMVGA 
LHDSKITGSM AGTGSRAVLS RLQAPTGKAY DAIKELGIKT SDSKGNTRPI FSILKEMQRS 
FEKNNLGTGQ KAEYMKTIFG EEASSAAAVL MAAASSGKLD QLTAAFKASD GKTEELVKVM 
QDNLGGDFKE FQSAYEAVGT DLFDQQEGSL RKLTQTATQY VLKIDGWITK NKGLATTIGV 
VVGGALALIG VMGGIGLVAW PVVMGINAII AAAGVLGVVF SSVGTAIGAI SLPVVAVVAA 
VVAGALLIRK YWEPISAFFS GVVEGLKAAF APVGEMFAPL APVFDSIAEK LGVVWKWFTD 
LLAPVKATQE TLDRCKNVGV AFGQALADAL MAPLNIFNSL SGKVSWLLEK LGVIKKESSD 
LDQNAAKTDK TAANGGYIPA TAAYGGYQSY QPVTAPAGRS YIDQSKSEYN ITLQGGVAAG 
SDLDRQLRDA VDKLDREKRA RQRSSMRHD