Gene EcSMS35_0812 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_0812
Symbol
ID	6146487
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	814194
End bp	815435
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	55%
IMG OID	641615700
Product	cardiolipin synthase 2
Protein accession	YP_001742892
Protein GI	170682929
COG category	[I] Lipid transport and metabolism
COG ID	[COG1502] Phosphatidylserine/phosphatidylglycerophosphate/cardiolipin synthases and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0377423
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	0.805381
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATGTA GCTGGCGCGA AGGCAATAAG ATCCAGTTGC TGGAAAACGG CGAGCAATAT 
TATCCCGCGG TGTTTAAGGC GATTGGCGAG GCGCAAGAAC GCATCATTCT TGAAACGTTT 
ATCTGGTTTG AGGATGACGT CGGCAAACAG CTGCATGCGG CGCTACTGGC AGCAGCGCAA 
CGCGGGGTGA AAGCGGAAGT CTTGCTGGAT GGCTACGGTT CGCCGGATCT CAGCGATGAG 
TTTGTCAATG AACTGACGGC AGCTGGCGTG GTATTTCGCT ACTACGATCC CCGCCCGCGC 
CTTTTTGGTA TGCGCACCAA TGTGTTTCGC CGGATGCATC GCAAAATTGT GGTGATCGAC 
GCGCTTATCG CCTTTATTGG CGGGCTGAAT TACTCCGCCG AGCATATGTC CAGCTACGGT 
CCAGAGGCCA AACAGGATTA CGCGGTACGC CTTGAAGGGC CGATTGTTGA AGATATCCTC 
CAGTTTGAAC AGGAAAATCT GCCAGGACAG AGCGCGGCCC GACGCTGGTG GCGACGTCAT 
CACAAAGCGG AAGAAAATCG CCAGCCGGGA GAAGCGCAGG TATTGCTGGT CTGGCGCGAT 
AACGAAGAAC ATCGCGATGA TATCGAACGT CACTATCTGA AAATGCTCAC TCAGGCGCGG 
CGAGAAGTGA TTATCGCCAA CGCCTACTTC TTCCCCGGCT ATCGATTTTT ACACGCCTTG 
CGTAAAGCGG CACGGCGCGG GGTGCGGATC AAACTGATCA TTCAGGGCGA ACCGGATATG 
CCGATTGTCA GAGTCGGTGC GCGTTTGCTG TATAACTATC TGGTTAAAGG CGGCGTTCAG 
GTGTTTGAGT ACCGCCGCCG TCCGCTACAT GGCAAAGTGG CATTGATGGA CGATCACTGG 
GCGACGGTAG GATCCAGTAA TCTCGATCCG CTCAGTTTGT CACTGAATCT CGAAGCAAAT 
GTCATCATCC ACGATCGTCA TTTTAACCAG ACGCTGCGTG ATAATCTGAA CGGCATTATC 
GCCGCAGATT GTCAGCAGGT GGATGAGACC ATGCTGCCGA AACGCACCTG GTGGAATCTG 
ACCAAAAGCG TGCTGGCCTT CCACTTTTTA CGCCACTTCC CGGCGCTGGT CGGCTGGCTT 
CCGGCACACA CGCCACGTCT GGCGCAGGTT GATCCCCCCG CACAACCGAC AATGGAAACG 
CAGGATCGGG TAGAAACTGA AAACACGGGG GTAAAACCCT GA

Protein sequence

MKCSWREGNK IQLLENGEQY YPAVFKAIGE AQERIILETF IWFEDDVGKQ LHAALLAAAQ 
RGVKAEVLLD GYGSPDLSDE FVNELTAAGV VFRYYDPRPR LFGMRTNVFR RMHRKIVVID 
ALIAFIGGLN YSAEHMSSYG PEAKQDYAVR LEGPIVEDIL QFEQENLPGQ SAARRWWRRH 
HKAEENRQPG EAQVLLVWRD NEEHRDDIER HYLKMLTQAR REVIIANAYF FPGYRFLHAL 
RKAARRGVRI KLIIQGEPDM PIVRVGARLL YNYLVKGGVQ VFEYRRRPLH GKVALMDDHW 
ATVGSSNLDP LSLSLNLEAN VIIHDRHFNQ TLRDNLNGII AADCQQVDET MLPKRTWWNL 
TKSVLAFHFL RHFPALVGWL PAHTPRLAQV DPPAQPTMET QDRVETENTG VKP