Gene Sala_1603 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_1603
Symbol
ID	4082755
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	+
Start bp	1679910
End bp	1681100
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	66%
IMG OID	638009972
Product	phospholipase D/transphosphatidylase
Protein accession	YP_616649
Protein GI	103487088
COG category	[I] Lipid transport and metabolism
COG ID	[COG1502] Phosphatidylserine/phosphatidylglycerophosphate/cardiolipin synthases and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.420349
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.113302
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGATC CCTGCCCCAC TGCCGATCCG ATGCAAGGGC TGACGGCGGA CGTGGCGGAT 
CATCGGATCG AGTTGATCTT CGACGGCGGC GAGCGGATGA CGCGCCTGCT CCGACTGATC 
GATCGGGCGG CGCACAGCAT CGACCTCATC ATCTATATAT TTGAAGGCGA CGCCGCAGGA 
CTCAGCGTCC TGCGCGCGCT GACCGCCGCG GCGCGGCGCG GCGTGCGCGT GCGCGTGTTG 
ATCGACAGCT TCGGGTCGGG CGACACGCCC GACGCGCTGT TCGCGCCGCT GCGCGAAGCG 
GGCGGCGGCG CCACCTTTTT CTCGCGCCGC TGGCGTTCGT CCTATCTCAT CCGCAATCAC 
CAGAAGCTGA TCCTGATCGA CAATGCGGTT GCCATGACGG GGGGCTTCAA CATCGCCGAC 
GATTATCTGA GCGCGCCGCG CAGCGATGGC TGGCTCGACA TCGGCATGAT CGTCGAGGGG 
CCGAGCGTCG CGCGCGCGGC CGACTGGTTT GCCGAAATCC ATGATTATAC GGTCAGCAAC 
GACGGTAAGC TCCTGATATT GCGGCGGCTG ATCCGCGAAT GGCCGGTCGA TGGCGGCGCA 
GTGTCATGGC TTGTCGGCGG GCCGACGCAG CGGCTTTCGC CCTGGGCACG CGCCGTGCGC 
GCCGACCTGA ACGATGCGCG TCAACTCGAC ATGGCAATGG CCTATTTTTC ACCCGGCCAG 
GGCCTGCTCC GCCGCCTCGG CCGCGTCGCG CAGCGCGGTC GCGCGCGCTT CATCATGGCG 
GGCAAGTCCG ACAATGGCGC CACGATCGGG GCCTCGCGCC TTCTCTATGG CTATCTGCTT 
CGCAAGGGCG CCGACGTGTG GGAATATCGG CGGTGCAAGC TGCACATGAA GCTGATCGTC 
GTCGACGATG TGGTCTATAT CGGCTCGGCC AATTTCGACG TGCGCAGCCT GTTCGTCAAT 
GTCGAGCTGA TGGTGCGGAT CGCCGATGCC GGCTTTGCGG CGCAGATGCG GCGCTTTGTG 
GCGGGCCTCC AGCCCGATTG CGACATCATC ACCGCCGAGG CGCACAAGGC ACGCGCAAGC 
TGGTGGACGC GGCTGCGCTG GACACTCGCC TGGTTCGTCG TCGGCGTCGC CGATTATACG 
GTGTCGCGCA AACTCAACTT CGGCCTCGGT GACCCCGATC CCGATGTCTA G

Protein sequence

MADPCPTADP MQGLTADVAD HRIELIFDGG ERMTRLLRLI DRAAHSIDLI IYIFEGDAAG 
LSVLRALTAA ARRGVRVRVL IDSFGSGDTP DALFAPLREA GGGATFFSRR WRSSYLIRNH 
QKLILIDNAV AMTGGFNIAD DYLSAPRSDG WLDIGMIVEG PSVARAADWF AEIHDYTVSN 
DGKLLILRRL IREWPVDGGA VSWLVGGPTQ RLSPWARAVR ADLNDARQLD MAMAYFSPGQ 
GLLRRLGRVA QRGRARFIMA GKSDNGATIG ASRLLYGYLL RKGADVWEYR RCKLHMKLIV 
VDDVVYIGSA NFDVRSLFVN VELMVRIADA GFAAQMRRFV AGLQPDCDII TAEAHKARAS 
WWTRLRWTLA WFVVGVADYT VSRKLNFGLG DPDPDV