Gene BURPS1106A_3390 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_3390
Symbol
ID	4901160
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	3307035
End bp	3308675
Gene Length	1641 bp
Protein Length	546 aa
Translation table	11
GC content	69%
IMG OID	640136616
Product	glutamate synthase
Protein accession	YP_001067627
Protein GI	126453095
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0069] Glutamate synthase domain 2
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.59396
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTTTCTC GACGCTATCT CGCGATGTGG TGCGCGCTCG CCCTCTTCGC GGCCGCCGCC 
GTGCTCGCGG CGCGGCACAC GATCTCGTGG CTGTGGATCG TGCCCGTCGC CGCGCTCGTC 
GCGCTCGGTC TGTACGACCT GAACCAGGAC CGCCACGCGA TCCTGCGCAA CTACCCGCTC 
TGGGGCCATC TGCGGTTCCT GTTCGAATTC ATCCGACCGG AAATCCGCCA GTACTTCGTC 
GAGGACGACA CCGACGAGAA GCCGTTCTCG CGCGCGCAGC GCAGCGTCGT CTACCAGCGC 
GCGAAGAACG TCGCCGACAA CCGGCCGTAC GGTACCGAGC TCGACGTGAA GGCGGTCGCG 
CACGAATGGA TCAGCCATTC GCTCGCGCCG ACGAAGCTCG ACGGCCACGA TTTCCGGATT 
CGCGTCGGCG CGACGCGCAA GCAGCCTTAT GACATCTCGA TCTTCAACAT CTCGGCGATG 
AGCTTCGGCG CGCTGTCGGC GAACGCGATC CGCGCGCTGA ATCTCGGCGC GAAGCAAGGC 
GGCTTCGCGC ACGACACGGG CGAAGGCTCG CTGTCGAAGT ATCACCGCGA GCACGGCGGC 
GACATCATCT GGGAAATCGG CTCCGGCTAC TTCGGCTGCC GCCGCGACGA CGGCACGTTC 
GATCCGGAGA AGTTCGCGAA ACAGGCGCGC GAGCCGCAGG TGAAGATGAT CGAGGTGAAG 
CTCTCGCAGG GCGCGAAGCC CGGCCACGGC GGCGTGCTGC CCGCCGCGAA GATCACGCCC 
GAGATCGCCG AGACGCGCGG CGTGCCGATG GGCAAGGATT GCGTGTCGCC CGCCGCGCAC 
TCGGCGTTCT CGACGCCGCG CGGGCTGCTC GAATTCGTCG ACCGGCTGCG CGAGCTCTCG 
GGCGGCAAGC CGACGGGCTT CAAGCTGTGC GTCGGCCATC CGTGGGAATT CTTCGGGATC 
GCGAAGGCGA TGCTCGAGAC GGGCATCGTG CCGGACTTCA TCGTCGTCGA CGGCGCGGAA 
GGCGGCACGG GCGCCGCGCC CCTCGAATTC ACCGATCACG TCGGCGTGCC GTTGCAGGAA 
GGGCTGCTGC TCGTGCACAA CACGCTCGTC GGGATCGGGC TGCGCGAACA GGTGAAGCTC 
GGCGCGAGCG GCAAGATCAT CACCGCGTTC GACATCGCGC GCACGCTCGC GATCGGCGCG 
GACTGGGTGA ACTCCGCGCG CGGCTTCATG TTCGCGGTCG GCTGCATCCA GGCGCAGCAC 
TGCCACACCG ACCGCTGCCC GACGGGCGTC GCGACGCAGG ACCCGGTGCG CCAGCGCGCG 
CTCGTCGTGC CGGACAAGGC CGATCGCGTC TACAACTTCC ATCGCAACAC GCTGCACGCG 
TTGCAGGAGC TCGTGCAGGC GGCGGGGCTG TCGCACCCGT CCGAGCTGCG CGCGCATCAC 
ATCGTGCAGC GCGTCGCGCC GCACGAAGTC CGGCTGATGT CGCAACTGCT GAAGTATCTG 
GAGCCGGGCG CGCTGCTCAA CGGCGGCCAT TGCGGCTTCT CGCTGTACGA GACGTGGTGG 
CCGCTCGCGC GCGGCGATTC GTTCTCGCCC GGCGAAGGCG CGTACGCGCG CGTCGGCACG 
GGCGCGCCGG CGCGCGCGTA G

Protein sequence

MLSRRYLAMW CALALFAAAA VLAARHTISW LWIVPVAALV ALGLYDLNQD RHAILRNYPL 
WGHLRFLFEF IRPEIRQYFV EDDTDEKPFS RAQRSVVYQR AKNVADNRPY GTELDVKAVA 
HEWISHSLAP TKLDGHDFRI RVGATRKQPY DISIFNISAM SFGALSANAI RALNLGAKQG 
GFAHDTGEGS LSKYHREHGG DIIWEIGSGY FGCRRDDGTF DPEKFAKQAR EPQVKMIEVK 
LSQGAKPGHG GVLPAAKITP EIAETRGVPM GKDCVSPAAH SAFSTPRGLL EFVDRLRELS 
GGKPTGFKLC VGHPWEFFGI AKAMLETGIV PDFIVVDGAE GGTGAAPLEF TDHVGVPLQE 
GLLLVHNTLV GIGLREQVKL GASGKIITAF DIARTLAIGA DWVNSARGFM FAVGCIQAQH 
CHTDRCPTGV ATQDPVRQRA LVVPDKADRV YNFHRNTLHA LQELVQAAGL SHPSELRAHH 
IVQRVAPHEV RLMSQLLKYL EPGALLNGGH CGFSLYETWW PLARGDSFSP GEGAYARVGT 
GAPARA