Gene ECD_10056 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_10056
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	+
Start bp	788125
End bp	789330
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	58%
IMG OID
Product	Tail fiber protein
Protein accession	ACT42638
Protein GI	253976968
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAGTAA AGATTTCAGG AGTCCTGAAA GACGGCACAG GAAAACCGGT ACAGAACTGC 
ACCATTCAGC TGAAAGCCAG ACGTAACAGC ACCACGGTGG TGGTGAACAC GGTGGGCTCA 
GAGAATCCGG ATGAAGCCGG GCGTTACAGC ATGGATGTGG AGTACGGTCA GTACAGTGTC 
ATCCTGCAGG TTGACGGTTT TCCACCATCG CACGCCGGGA CCATCACCGT GTATGAAGAT 
TCACAACCGG GGACGCTGAA TGATTTTCTC TGTGCCATGA CGGAGGATGA TGCCCGGCCG 
GAGGTGCTGC GTCGTCTTGA ACTGATGGTG GAAGAGGTGG CGCGTAACGC GTCCGTGGTG 
GCACAGAGTA CGGCAGACGC GAAGAAATCA GCCGGCGATG CCAGTGCATC AGCTGCTCAG 
GTCGCGGCCC TTGTGACTGA TGCAACTGAC TCAGCACGCG CCGCCAGCAC GTCCGCCGGA 
CAGGCTGCAT CGTCAGCTCA GGAAGCGTCC TCCGGCGCAG AAGCGGCATC AGCAAAGGCC 
ACTGAAGCGG AAAAAAGTGC CGCAGCCGCA GAGTCCTCAA AAAACGCGGC GGCCACCAGT 
GCCGGTGCGG CGAAAACGTC AGAAACGAAT GCTGCAGCGT CACAACAATC AGCCGCCACG 
TCTGCCTCCA CCGCGGCCAC GAAAGCGTCA GAGGCCGCCA CTTCAGCACG AGATGCGGTG 
GCCTCAAAAG AGGCAGCAAA ATCATCAGAA ACGAACGCAT CATCAAGTGC CGGTCGTGCA 
GCTTCCTCGG CAACGGCGGC AGAAAATTCT GCCAGGGCGG CAAAAACGTC CGAGACGAAT 
GCCAGGTCAT CTGAAACAGC AGCGGAACGG AGCGCCTCTG CCGCGGCAGA CGCAAAAACA 
GCGGCGGCGG GGAGTGCGTC AACGGCATCC ACGAAGGCGA CAGAGGCTGC GGGAAGTGCG 
GTATCAGCAT CGCAGAGCAA AAGTGCGGCA GAAGCGGCGG CAATACGTGC AGAAAATTCG 
GCAAAACGTG CAGAAGATAT AGCTTCAGCT GTCGCGCTTG AGGATGCGGA CACAACGAGA 
AAGGGGATAG TGCAGCTCAG CAGTGCAACC AACAGCACGT CTGAAACGCT TGCTGCAACG 
CCAAAGGCGG TTAAGGTGGT AATGGATGAA ACGAACAGAA AAGCCCACTG GACAGTCCGG 
CACTGA

Protein sequence

MAVKISGVLK DGTGKPVQNC TIQLKARRNS TTVVVNTVGS ENPDEAGRYS MDVEYGQYSV 
ILQVDGFPPS HAGTITVYED SQPGTLNDFL CAMTEDDARP EVLRRLELMV EEVARNASVV 
AQSTADAKKS AGDASASAAQ VAALVTDATD SARAASTSAG QAASSAQEAS SGAEAASAKA 
TEAEKSAAAA ESSKNAAATS AGAAKTSETN AAASQQSAAT SASTAATKAS EAATSARDAV 
ASKEAAKSSE TNASSSAGRA ASSATAAENS ARAAKTSETN ARSSETAAER SASAAADAKT 
AAAGSASTAS TKATEAAGSA VSASQSKSAA EAAAIRAENS AKRAEDIASA VALEDADTTR 
KGIVQLSSAT NSTSETLAAT PKAVKVVMDE TNRKAHWTVR H