Gene BURPS1106A_A2337 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A2337
Symbol
ID	4903350
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	+
Start bp	2314466
End bp	2315485
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	73%
IMG OID	640145442
Product	putative lyase
Protein accession	YP_001076370
Protein GI	126457117
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2301] Citrate lyase beta subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCGCGC TCACACCCGC AGAAGTGCTG TACGAAGGCG TTGCGCCGCC CGCGATCCTG 
CCGTGCTGCG ATCATTACGC GGGCAGCGAG AAGCTGATGC TCAAATCGCT CGCGCTGCAG 
GCCGAGCTCG GTCCCGTCTT CGACATCACG CTCGACTGCG AGGACGGCGC GGCCGTCGGC 
CGCGAGGCCG AGCACGCGGC GCGCGTCGCC GCGCTCGTCG GCGGCGAGGC GAACCGCTTC 
GGGCGCGTCG GCGTGCGTAT CCACGACATT TCCCACCCTC ACTGGCGCGA CGACGTGCGC 
GTCGTCCTGC GCGCGGCGCG CCCGCCCGCG TACCTGACGC TGCCGAAGGT CGGCGGCGCG 
GCCGACGCGG CCGAAATGTG CGCGTTCATC GAGGCGTCCC GCGTCGAGCT CGGCATCGCG 
CAGCCGATCC CCGTCGACGT GCTGATCGAG ACGCACGGCG CGCTCGCCGA CGCCGCGCGG 
ATCGCCGCGC TGCCGATCGT CGCGACCCTG AGCTTCGGCC TGATGGATTT CGTATCCGCG 
CATCACGGCG CGATTCCGGA CGACGCGATG CGCGCGCCCG GCCAGTTCGA CCACCCGCTC 
GTGCGCCGCG CGAAGCTCGA GATCGCCGCC GCGTGCCACG CGCACGGCAA GACGCCGTCG 
CACAACGTGA CGACCGAGGT ACGCGACATG CGCGTCGTCG CGAACGACGC GCGCCGCGCC 
CGCGAGGAAT TCGGCTACAC GCGGATGTGG AGCATCCACC CGGCGCAGAT CCGCGAGATC 
GTCGCCGCGT TCGCGCCGCG CGCGGACGAC ATCGCGCGCG CGAGCCGCAT CCTGCTCGCC 
GCGCAGGCGG CCGACTGGGG CCCGACGCGG CATGACGACG CGCTGCACGA CCGCGCGAGC 
TACCGCTACT ACTGGGCGGT GCTGCGCCGC GCGCGCGCGA CCGGCCAGCC GCTGCCCGCC 
GAGTCGGCGC CGCTCTTCGG CGACGCCGGC GAACGGGCCG CGCGGGGACG CGAAAAATGA

Protein sequence

MSALTPAEVL YEGVAPPAIL PCCDHYAGSE KLMLKSLALQ AELGPVFDIT LDCEDGAAVG 
REAEHAARVA ALVGGEANRF GRVGVRIHDI SHPHWRDDVR VVLRAARPPA YLTLPKVGGA 
ADAAEMCAFI EASRVELGIA QPIPVDVLIE THGALADAAR IAALPIVATL SFGLMDFVSA 
HHGAIPDDAM RAPGQFDHPL VRRAKLEIAA ACHAHGKTPS HNVTTEVRDM RVVANDARRA 
REEFGYTRMW SIHPAQIREI VAAFAPRADD IARASRILLA AQAADWGPTR HDDALHDRAS 
YRYYWAVLRR ARATGQPLPA ESAPLFGDAG ERAARGREK