Gene Ent638_3476 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_3476
Symbol
ID	5112981
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009436
Strand	-
Start bp	3783920
End bp	3785083
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	58%
IMG OID	640493681
Product	phage late control D family protein
Protein accession	YP_001178186
Protein GI	146313112
COG category	[R] General function prediction only
COG ID	[COG3500] Phage protein D
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.216601
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.122645
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATAACGG ATATGAATAT TCAGGCCGGG GCACGCATCG CGCCTGCGTA TATGCTCACG 
CTCAATGGCG CGGATATCAC ACAGAATTTT AGCGACCGGC TTATCGGGCT GACCATGACC 
GACAATCGCG GATTTGAGGC TGACCAGCTC GATATCGAGC TTGATGATAC CGACGGGCTG 
GTCGAGTTGC CGCCGCGCGG GGCAAAGCTG ACGCTGTGGT TAGGCTGGCA GGGCTCCGCG 
CTGGTGAATA AGGGGAGTTT TACGGTCGAT GAAATCGAGC ACCGGGGCGC GCCCGATACG 
CTGACCATCC GGGGGCGCAG TGCGGATTTT CGCGGGACGC TTAACTCTCG CCGCGAGCAG 
TCATGGCATG ACACTACGCT CGGGGTGATT GTCGAGACCA TCGCGCAGCG TAACAAACTG 
ACGGCCAGCA TGGCGGATAC CCTGAAAGCC ATTGCGATCC CGCATATCGA CCAGGCGCAG 
GAATCGGACA CGGCGTTTTT GTCCAGGCTG GCGGAGCGTA ACGGGGCGTC TGTCTCAGTA 
AAAGCCGGGA AATTATTATT CCTGAAAGCG GGTAGCGCGA TGACGGCCAG CGGCAAACCC 
ATCCCGCAAA TGACCGTCGA GCGCGGTGAC GGCGACCGGC ATCAGTTCGC CATTGCTGAC 
CGGGAGGCGT ACACCGGCGT CACGGCGAAA TGGCTGCACA CGAAAGACCC GAAACCGCTA 
AAGCAAAAGG TGAAGCTGAA ACGAAAGCCA AAGGTGCAGC ACCTGCGCGC GCTACAGCAT 
CCGAAAGCGG CTAAAACCAC GGCAAAGGCC AAAGCCAAAA AGGAGCAGGA AGCGCGCGAG 
GGTGAGTATA TGGTCGGTGA GGCTGACAAC GTGCTGGAGC TCACGACCAT CTACGCCACA 
AAGGCGCAGG CCATGCGCGC TGCTCAGGCG AAGTGGGACA AAATACAGCG CGGAGTGGCG 
GAGTTTTCAA TCTCGCTGGC GTATGGCCGT GCTGATTTAT TTCCTGAAAC GCCGGTTGCG 
GTGAAGGGCT TTAAGCGCGT GATAGACGAG CAGGCGTGGA TAATCAGCCG GGTGGTGCAT 
AACCTCAACG GGAACGGCTA CACGACGGGC TTAGAGCTCG AGGTGAAGCT TTCGGATGTT 
GAATATGTAG CGGAGGAGGA TTAA

Protein sequence

MITDMNIQAG ARIAPAYMLT LNGADITQNF SDRLIGLTMT DNRGFEADQL DIELDDTDGL 
VELPPRGAKL TLWLGWQGSA LVNKGSFTVD EIEHRGAPDT LTIRGRSADF RGTLNSRREQ 
SWHDTTLGVI VETIAQRNKL TASMADTLKA IAIPHIDQAQ ESDTAFLSRL AERNGASVSV 
KAGKLLFLKA GSAMTASGKP IPQMTVERGD GDRHQFAIAD REAYTGVTAK WLHTKDPKPL 
KQKVKLKRKP KVQHLRALQH PKAAKTTAKA KAKKEQEARE GEYMVGEADN VLELTTIYAT 
KAQAMRAAQA KWDKIQRGVA EFSISLAYGR ADLFPETPVA VKGFKRVIDE QAWIISRVVH 
NLNGNGYTTG LELEVKLSDV EYVAEED