Gene ECD_10039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_10039
Symbol	C
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	+
Start bp	772892
End bp	774211
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	61%
IMG OID
Product	capsid component
Protein accession	ACT42621
Protein GI	253976951
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACAGCAG AGCTGCGTAA TCTCCCGCAT ATTGCCAGCA TGGCCTTTAA TGAGCCGCTG 
ATGCTTGAAC CCGCCTATGC GCGGGTTTTC TTTTGTGCGC TTGCAGGCCA GCTTGGGATC 
AGCAGCCTGA CGGATGCGGT GTCCGGCGAC AGCCTGACTG CCCAGGAGGC ACTCGCGACG 
CTGGCATTAT CCGGTGATGA TGACGGACCA CGACAGGCCC GCAGTTATCA GGTCATGAAC 
GGCATCGCCG TGCTGCCGGT GTCCGGCACG CTGGTCAGCC GGACGCGGGC GCTGCAGCCG 
TACTCGGGGA TGACCGGTTA CAACGGCATT ATCGCCCGTC TGCAACAGGC TGCCAGCGAT 
CCGATGGTGG ACGGCATTCT GCTCGATATG GACACGCCCG GCGGGATGGT GGCGGGGGCA 
TTTGACTGCG CTGACATCAT CGCCCGTGTG CGTGACATAA AACCGGTATG GGCGCTTGCC 
AACGACATGA ACTGCAGTGC AGGTCAGTTG CTTGCCAGTG CCGCCTCCCG GCGTCTGGTC 
ACGCAGACCG CCCGGACAGG CTCCATCGGC GTCATGATGG CTCACAGTAA TTACGGTGCT 
GCGCTGGAGA AACAGGGTGT GGAAATCACG CTGATTTACA GCGGCAGCCA TAAGGTGGAT 
GGCAACCCCT ACAGCCATCT TCCGGATGAC GTCCGGGAGA CACTGCAGTC CCGGATGGAC 
GCAACCCGCC AGATGTTTGC GCAGAAGGTG TCGGCATATA CCGGCCTGTC CGTGCAGGTT 
GTGCTGGATA CCGAGGCTGC AGTGTACAGC GGTCAGGAGG CCATTGATGC CGGACTGGCT 
GATGAACTTG TTAACAGCAC CGATGCGATC ACCGTCATGC GTGATGCACT GGATGCACGT 
AAATCCCGTC TCTCAGGAGG GCGAATGACC AAAGAGACTC AATCAACAAC TGTTTCAGCC 
ACTGCTTCGC AGGCTGACGT TACTGACGTG GTGCCAGCGA CGGAGGGCGA GAACGCCAGC 
GCGGCGCAGC CGGACGTGAA CGCGCAGATC ACCGCAGCGG TTGCGGCAGA AAACAGCCGC 
ATTATGGGGA TACTCAACTG TGAGGAGGCT CACGGACGCG AAGAACAGGC ACGCGTGCTG 
GCAGAAACCC CCGGTATGAC CGTGAAAACG GCCCGCCGCA TTCTGGCCGC AGCACCACAG 
AGTGCACAGG CGCGCAGTGA CACTGCGCTG GATCGTCTGA TGCAGGGGGC ACCGGCACCG 
CTGGCTGCAG GTAACCCGGC ATCTGATGCC GTTAACGATT TGCTGAACAC ACCAGTGTAA

Protein sequence

MTAELRNLPH IASMAFNEPL MLEPAYARVF FCALAGQLGI SSLTDAVSGD SLTAQEALAT 
LALSGDDDGP RQARSYQVMN GIAVLPVSGT LVSRTRALQP YSGMTGYNGI IARLQQAASD 
PMVDGILLDM DTPGGMVAGA FDCADIIARV RDIKPVWALA NDMNCSAGQL LASAASRRLV 
TQTARTGSIG VMMAHSNYGA ALEKQGVEIT LIYSGSHKVD GNPYSHLPDD VRETLQSRMD 
ATRQMFAQKV SAYTGLSVQV VLDTEAAVYS GQEAIDAGLA DELVNSTDAI TVMRDALDAR 
KSRLSGGRMT KETQSTTVSA TASQADVTDV VPATEGENAS AAQPDVNAQI TAAVAAENSR 
IMGILNCEEA HGREEQARVL AETPGMTVKT ARRILAAAPQ SAQARSDTAL DRLMQGAPAP 
LAAGNPASDA VNDLLNTPV