Gene EcSMS35_3974 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3974
Symbol	coaBC
ID	6146294
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	4050752
End bp	4051972
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	54%
IMG OID	641618800
Product	bifunctional phosphopantothenoylcysteine decarboxylase/phosphopantothenate synthase
Protein accession	YP_001745939
Protein GI	170682495
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0452] Phosphopantothenoylcysteine synthetase/decarboxylase
TIGRFAM ID	[TIGR00521] phosphopantothenoylcysteine decarboxylase/phosphopantothenate--cysteine ligase, prokaryotic

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.000000792039
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	60
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCTGG CCGGTAAAAA AATCGTTCTC GGCGTCAGCG GCGGTATTGC TGCCTATAAA 
ACCCCTGAAC TGGTGCGTCG TTTGCGCGAT CGCGGGGCCG ACGTCCGCGT AGCCATGACC 
GAAGCGGCAA AAGCCTTTAT CACCCCACTT AGCTTGCAGG CGGTTTCTGG TTATCCCGTT 
TCCGACAGTC TGCTGGACCC GGCAGCCGAA GCCGCTATGG GCCATATTGA GCTGGGTAAA 
TGGGCTGATT TAGTGATTCT CGCCCCTGCC ACGGCAGATT TAATTGCCCG TGTTGCTGCC 
GGAATGGCGA ATGACCTGGT ATCGACGATT TGTCTGGCTA CACCTGCGCC TGTAGCCGTG 
CTCCCCGCCA TGAACCAGCA GATGTACCGT GCCGCCGCCA CCCAGCATAA TTTAGAGGTG 
CTTGCCTCGC GTGGTTTGCT CATCTGGGGG CCAGACAGCG GCAGTCAGGC TTGTGGTGAT 
ATCGGCCCAG GGCGAATGCT CGATCCGTTA ACCATTGTGG ATATGGCGGT AGCGCATTTT 
TCGCCCGTCA ACGACCTGAA ACATCTGAAC ATTATGATTA CCGCCGGTCC GACGCGTGAA 
CCGCTCGATC CCGTGCGTTA TATCTCTAAT CACAGCTCCG GCAAGATGGG TTTTGCTATC 
GCCGCCGCCG CAGCCCGTCG TGGCGCGAAC GTCACGCTGG TATCAGGTCC GGTTTCACTA 
CCGACGCCAC CGTTTGTTAA CCGTGTTGAT GTGATGACCG CGCTGGAAAT GGAAGCCGCC 
GTGAATGCTT CTGTACAGCA GCAAAATATT TTTATCGGTT GCGCCGCCGT GGCGGATTAT 
CGCGCAGCTA CCGTGGCCCC AGAAAAAATC AAAAAGCAGG CCACGCAGGG TGATGAATTA 
ACAATAAAAA TGGTTAAAAA CCCCGATATC GTCGCAGGCG TTGCCGCACT AAAAGACCAT 
CGACCCTACG TCGTTGGATT TGCCGCCGAA ACAAATAATG TGGAAGAATA CGCCCGGCAA 
AAACGTATCC GTAAAAACCT TGATCTGATC TGCGCGAACG ATGTTTCCCA GCCAACTCAA 
GGATTTAACA GCGACAACAA CGCATTACAC CTTTTCTGGC AGGACGGAGA TAAAGTCTTA 
CCGCTTGAGC GCAAAGAGCT CCTTGGCCAA TTATTACTCG ACGAGATCGT GACCCGTTAT 
GATGAAAAAA ATCGACGTTA A

Protein sequence

MSLAGKKIVL GVSGGIAAYK TPELVRRLRD RGADVRVAMT EAAKAFITPL SLQAVSGYPV 
SDSLLDPAAE AAMGHIELGK WADLVILAPA TADLIARVAA GMANDLVSTI CLATPAPVAV 
LPAMNQQMYR AAATQHNLEV LASRGLLIWG PDSGSQACGD IGPGRMLDPL TIVDMAVAHF 
SPVNDLKHLN IMITAGPTRE PLDPVRYISN HSSGKMGFAI AAAAARRGAN VTLVSGPVSL 
PTPPFVNRVD VMTALEMEAA VNASVQQQNI FIGCAAVADY RAATVAPEKI KKQATQGDEL 
TIKMVKNPDI VAGVAALKDH RPYVVGFAAE TNNVEEYARQ KRIRKNLDLI CANDVSQPTQ 
GFNSDNNALH LFWQDGDKVL PLERKELLGQ LLLDEIVTRY DEKNRR