Gene ECD_10038 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_10038
Symbol	B
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	+
Start bp	771310
End bp	772911
Gene Length	1602 bp
Protein Length	533 aa
Translation table	11
GC content	58%
IMG OID
Product	capsid component
Protein accession	ACT42620
Protein GI	253976950
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAACGC CCACCATTCC CACCCTTCTG GGGCCGGACG GCATGACATC GCTGCGCGAA 
TATGCCGGTT ATCACGGCGG TGGCAGCGGA TTTGGAGGGC AGTTGCGGTC GTGGAACCCA 
CCGAGTGAAA GTGTGGATGC AGCCCTGTTG CCCAACTTTA CCCGTGGCAA TGCCCGCGCA 
GACGATCTGG TACGCAATAA CGGCTATGCC GCCAACGCCA TCCAGCTGCA TCAGGATCAT 
ATCGTCGGGT CTTTTTTCCG GCTCAGTCAT CGCCCAAGCT GGCGCTATCT GGGCATCGGG 
GAGGAAGAAG CCCGTGCCTT TTCCCGCGAG GTTGAAGCGG CATGGAAAGA GTTTGCCGAG 
GATGACTGCT GCTGCATTGA CGTTGAGCGA AAACGCACGT TTACCATGAT GATTCGGGAA 
GGTGTGGCCA TGCACGCCTT TAACGGTGAA CTGTTCGTTC AGGCCACCTG GGATACCAGT 
TCGTCGCGGC TTTTCCGGAC ACAGTTCCGG ATGGTCAGCC CGAAGCGCAT CAGCAACCCG 
AACAATACCG GCGACAGCCG GAACTGCCGT GCCGGTGTGC AGATTAATGA CAGCGGTGCG 
GCGCTGGGAT ATTACGTCAG CGAGGACGGG TATCCTGGCT GGATGCCGCA GAAATGGACA 
TGGATACCCC GTGAGTTACC CGGCGGGCGC GCCTCGTTCA TTCACGTTTT TGAACCCGTG 
GAGGACGGGC AGACTCGCGG TGCAAATGTG TTTTACAGCG TGATGGAGCA GATGAAGATG 
CTCGACACGC TGCAGAACAC GCAGCTGCAG AGCGCCATTG TGAAGGCGAT GTATGCCGCC 
ACCATTGAGA GTGAGCTGGA TACGCAGTCA GCGATGGATT TTATTCTGGG CGCGAACAGT 
CAGGAGCAGC GGGAAAGGCT GACCGGCTGG ATTGGTGAAA TTGCCGCGTA TTACGCCGCA 
GCGCCGGTCC GGCTGGGAGG CGCAAAAGTA CCGCACCTGA TGCCGGGTGA CTCACTGAAC 
CTGCAGACGG CTCAGGATAC GGATAACGGC TACTCCGTGT TTGAGCAGTC ACTGCTGCGG 
TATATCGCTG CCGGGCTGGG TGTCTCGTAT GAGCAGCTTT CCCGGAATTA CGCCCAGATG 
AGCTACTCCA CGGCACGGGC CAGTGCGAAC GAGTCGTGGG CGTACTTTAT GGGGCGGCGA 
AAATTCGTCG CATCCCGTCA GGCGAGCCAG ATGTTTCTGT GCTGGCTGGA AGAGGCCATC 
GTTCGCCGCG TGGTGACGTT ACCTTCAAAA GCGCGCTTCA GTTTTCAGGA AGCCCGCAGT 
GCCTGGGGGA ACTGCGACTG GATAGGCTCC GGTCGTATGG CCATCGATGG TCTGAAAGAA 
GTTCAGGAAG CGGTGATGCT GATAGAAGCC GGACTGAGTA CCTACGAGAA AGAGTGCGCA 
AAACGCGGTG ACGACTATCA GGAAATTTTT GCCCAGCAGG TCCGTGAAAC GATGGAGCGC 
CGTGCAGCCG GTCTTAAACC GCCCGCCTGG GCGGCTGCAG CATTTGAATC CGGGCTGCGA 
CAATCAACAG AGGAGGAGAA GAGTGACAGC AGAGCTGCGT AA

Protein sequence

MKTPTIPTLL GPDGMTSLRE YAGYHGGGSG FGGQLRSWNP PSESVDAALL PNFTRGNARA 
DDLVRNNGYA ANAIQLHQDH IVGSFFRLSH RPSWRYLGIG EEEARAFSRE VEAAWKEFAE 
DDCCCIDVER KRTFTMMIRE GVAMHAFNGE LFVQATWDTS SSRLFRTQFR MVSPKRISNP 
NNTGDSRNCR AGVQINDSGA ALGYYVSEDG YPGWMPQKWT WIPRELPGGR ASFIHVFEPV 
EDGQTRGANV FYSVMEQMKM LDTLQNTQLQ SAIVKAMYAA TIESELDTQS AMDFILGANS 
QEQRERLTGW IGEIAAYYAA APVRLGGAKV PHLMPGDSLN LQTAQDTDNG YSVFEQSLLR 
YIAAGLGVSY EQLSRNYAQM SYSTARASAN ESWAYFMGRR KFVASRQASQ MFLCWLEEAI 
VRRVVTLPSK ARFSFQEARS AWGNCDWIGS GRMAIDGLKE VQEAVMLIEA GLSTYEKECA 
KRGDDYQEIF AQQVRETMER RAAGLKPPAW AAAAFESGLR QSTEEEKSDS RAA