Gene Smed_4043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4043
Symbol
ID	5318610
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	505436
End bp	507154
Gene Length	1719 bp
Protein Length	572 aa
Translation table	11
GC content	62%
IMG OID	640775851
Product	phospholipase D/transphosphatidylase
Protein accession	YP_001312784
Protein GI	150376188
COG category	[I] Lipid transport and metabolism
COG ID	[COG1502] Phosphatidylserine/phosphatidylglycerophosphate/cardiolipin synthases and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGGTGC TGCACCGCGA GAGCCCTGGG AAGCTTTATT CGGCAGCTAT GCTGTTGCTG 
GAACAAATCA CGGTTGAAAG GGATTCATTT CCAATCGGAA TGCACGGGAT AGGAAGCTTG 
GACTGGAAAA ACGCGCTCAC CGGAAATACG GCCGGCCGAT TGCGACGGGC AAGCCGGCCG 
ATTATCAAGG AGGCCGAAAA TGTCTGGCGC AGCGCGCCCG CACGACATCT CTCGTTCCTC 
GTGGATGCAG CAGCCTATTA TGCCTGTCTC GACACCATGT TCGAGGAAGC GGAAGAGCAG 
CTGTGGATCA CCGGCTGGGA CTTCGATCCG CGCATCAAGC TCAGGCCGGA AGACCCGCAT 
GCGGAATCCC TTGGAAGCAC GCTTGAGCGG CTGGCTGCGC AGAAGCCCGA CCTGAAAATC 
CGCATTCTCA TTTGGGCGAT GGGCCCCATT TATTCGGGAA AGTCGCTCAG GCTTTTCCGC 
AAGCAGCAAT GGGCAGCGCA TCCGCAGATC GAGCTCCGCT TCGCGAGCCA TCGCGCGCTG 
CGAGGGTCGC ATCATCAGAA GCTCGTCTGC ATCGATGACA GGATCGCCTT CGCGGGGGGC 
ATCGACCTGA CGGCGCGCCG CTGGGACACG CCGGAACACG CGGCAGAGAA CGAGTTGCGT 
CGAGATCCGG ACGGCAAGCC TTATGACCCG GTGCATGACA TCCAGGCGAT TGTCGAAGGC 
GAGGCGAGCC GCGCGATCGG TGATCTCTGC CGCGCCCGCT GGACAGCCTC CACCGGCGAA 
GAAGTCGAAG CTCCGCGTGC GAAGGCATCA AAAGGCGCGC GCACATGGCC ATGGCCCAAC 
GGCACCGTGC CGATCCTCGA AAATTGCCCG GTCGCAATCG CCCGGACCGA GCCCGGCTCC 
GGCAAAAAGC GCGCCCGCCG GGAAGCATTG CGGCTGACGC TTGACGCCTT GCGCAGCGCG 
CGTCGCCACA TCTATATCGA AAACCAGTAT TTCGCGTCCG GAAGGATAGG GCAGCTGCTC 
TGCGACCGGC TGCAGGAGCC GGACGGCCCG GAAGTGGTGA TCATCACGAC CCGAAGCTCG 
CATGGGCTGC TGGAACGCAT CGTCATGGGC GGCAACCGCG ACCGTCTCAT TCGACGGCTC 
ACACAGGCTG ACCGTTACGG CAGGCTCAGG GTTGCCTATC CGGCCGTTCC CGCCCCCGAC 
GGATCCGAGC AGGAGGTGAT GATCCATTCC AAGGTGGTCG CGATCGACGA CCGCTTTTTC 
CGGGTCGGTT CGTCGAACTT CAACAACCGC TCGGAAAGCC TCGACACCGA ATGCGATGTT 
GCCGTGGAAG CCGCCAATGA AGGACACCGC GCGGCAATTG CCAAAATACG CAATGGCCTG 
ATCGCAGAAC ATCTCGACGT CCATGCGGAC GCCTTCGCAG AGGCCCTGAG GGAAACGAGC 
TCCCTCATAG CCGCCATAGA CAGGTTGAAC ACGCGCCCGC GCGGCATACG CAGCTTTGAC 
GGAATCGACA ATGGCGGCGC GACCGATCTG GTCTGGGGAA CGGAGATCAT CGATCCGCAG 
CGGCCGATCC GGCCCTTTTA TCGCACGCAC AAGCTGCTCA GGCGCTGGGT CGGTCAGCTT 
TTCGCCTTGC TCGCGAGGCT CTTATCGTCG TCGCGACGGG CAGCGAGCTC CGCAACGGAC 
AGCGATATCA AGCCCAGCGG CAGCGGCAGG AAGAAATAG

Protein sequence

MAVLHRESPG KLYSAAMLLL EQITVERDSF PIGMHGIGSL DWKNALTGNT AGRLRRASRP 
IIKEAENVWR SAPARHLSFL VDAAAYYACL DTMFEEAEEQ LWITGWDFDP RIKLRPEDPH 
AESLGSTLER LAAQKPDLKI RILIWAMGPI YSGKSLRLFR KQQWAAHPQI ELRFASHRAL 
RGSHHQKLVC IDDRIAFAGG IDLTARRWDT PEHAAENELR RDPDGKPYDP VHDIQAIVEG 
EASRAIGDLC RARWTASTGE EVEAPRAKAS KGARTWPWPN GTVPILENCP VAIARTEPGS 
GKKRARREAL RLTLDALRSA RRHIYIENQY FASGRIGQLL CDRLQEPDGP EVVIITTRSS 
HGLLERIVMG GNRDRLIRRL TQADRYGRLR VAYPAVPAPD GSEQEVMIHS KVVAIDDRFF 
RVGSSNFNNR SESLDTECDV AVEAANEGHR AAIAKIRNGL IAEHLDVHAD AFAEALRETS 
SLIAAIDRLN TRPRGIRSFD GIDNGGATDL VWGTEIIDPQ RPIRPFYRTH KLLRRWVGQL 
FALLARLLSS SRRAASSATD SDIKPSGSGR KK