Gene BURPS668_A2437 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A2437
Symbol	metZ
ID	4887022
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	-
Start bp	2354663
End bp	2355934
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	67%
IMG OID	640132374
Product	O-succinylhomoserine sulfhydrylase
Protein accession	YP_001063431
Protein GI	126444271
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0626] Cystathionine beta-lyases/cystathionine gamma-synthases
TIGRFAM ID	[TIGR01325] O-succinylhomoserine sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.391584
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGGGC TTTTTGTTGG TCTGCGCATT CGCCGCGCGA CGCGCACGGC GGCGATGCGC 
TTGAAAACGG ATGAACGGAA CATGGACGAC TCTCTCAACT TCGACACGCT CGCCGTCCGC 
TCGGGCACGC TGCGCAGTGA ATTCAACGAG CATTCGGAAG CGCTCTTCCT CACGTCGAGC 
TTCTGCTACG CGAGCGCGGC CGAGGCGGCC GAGCGCTTCA AGCATTCGGA AGACTACTAC 
ACGTACTCGC GCTTCACGAA TCCGACCGTC ACGATGTTCC AGGATCGCCT CGCGGCGCTC 
GAGGGCGGCG AGGCGTGCAT CGCGACCGCG TCCGGAATGG CGGCGATCAC GTCGGTCGTG 
ATGGCTGCGC TGCAGGCGGG CGATCACCTC GTCAGCTCGC GCAGCCTGTT CGGCTCGACG 
CTCGGGCTGT TCGGGCAGAT CTTCGCGAAG TTCGGCATCG AGACGACGTT CGTCGATCCG 
GCCGATCTCG ACGCATGGCG CGCCGCCGTG CGCCCCGAGA CGAAGATGTT CTTCCTCGAG 
ACGCCGTCGA ACCCGATGAC CGAGCTCGCC GACATCGAGG CGGTGGGCAG GATCGCGAAG 
GCGGCCCATG CGCTGTTCGT CGTCGACAAC TGTTTCTGCA GCCCGGTGCT GCAGCAGCCG 
CTCAAGCTCG GCGCGGACGT CGTGATGCAT TCGGCCACCA AGTTCCTCGA CGGTCAGGGG 
CGCGTGCTCG GCGGCGCGCT CGTCGGCTCG AAGGCGTTCA TCATGGAGAA GGTGTTCCCG 
TTCGTGCGCA CCGCGGGGCC GACGCTGTCC GCGTTCAATG CGTGGGTGCT GCTCAAGGGC 
ATGGAGACGC TGTCGCTGCG CGTGAACCGG CAATCGGAGA ACGCGCTCGA GATCGCCCGC 
TGGCTCGAGG CGCATCCGGC CGTGAAGCGC GTGTTCTATC CGGGGCTCGA ATCGCATCCG 
CAGCATGCGC TCGCGAAGCG CCAGCAGAAA TCGGGCGGCT CGGTCGTGTC GTTCGAGCTG 
AACGGCGATA CGCCGGAGCA GCAGCGCGCG AACGCGTGGC GTGTGATCGA CGGCACGAAG 
ATCGTATCGA TCACCGCGAA CCTCGGCGAC ACGCGCACGA CGATCACGCA TCCGGCGACG 
ACGACGCACA GCCGGATCGC GCCTGAAGCG CGCGAGGCGG CGGGGATCAC CGAAGGGCTG 
ATCCGGCTCG CGGTCGGGCT CGAGGATCCG GCCGACATCC GCGACGATCT CGCGCGCGGG 
CTCGCCGGCT GA

Protein sequence

MSGLFVGLRI RRATRTAAMR LKTDERNMDD SLNFDTLAVR SGTLRSEFNE HSEALFLTSS 
FCYASAAEAA ERFKHSEDYY TYSRFTNPTV TMFQDRLAAL EGGEACIATA SGMAAITSVV 
MAALQAGDHL VSSRSLFGST LGLFGQIFAK FGIETTFVDP ADLDAWRAAV RPETKMFFLE 
TPSNPMTELA DIEAVGRIAK AAHALFVVDN CFCSPVLQQP LKLGADVVMH SATKFLDGQG 
RVLGGALVGS KAFIMEKVFP FVRTAGPTLS AFNAWVLLKG METLSLRVNR QSENALEIAR 
WLEAHPAVKR VFYPGLESHP QHALAKRQQK SGGSVVSFEL NGDTPEQQRA NAWRVIDGTK 
IVSITANLGD TRTTITHPAT TTHSRIAPEA REAAGITEGL IRLAVGLEDP ADIRDDLARG 
LAG