Gene BURPS668_3355 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_3355
Symbol
ID	4883668
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	+
Start bp	3290785
End bp	3292425
Gene Length	1641 bp
Protein Length	546 aa
Translation table	11
GC content	69%
IMG OID	640129283
Product	glutamate synthase
Protein accession	YP_001060366
Protein GI	126440576
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0069] Glutamate synthase domain 2
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTTTCTC GACGCTATCT CGCGATGTGG TGCGCGCTCG CCCTCTTCGC GGCCGCCGCC 
GTGCTCGCGG CGCGGCACAC GATCTCGTGG CTGTGGATCG TGCCCGTCGC CGCGCTCGTC 
GCGCTCGGTC TGTACGACCT GAACCAGGAC CGCCACGCGA TCCTGCGCAA CTACCCGCTC 
TGGGGCCATC TGCGGTTCCT GTTCGAATTC ATCCGACCGG AAATCCGCCA GTACTTCGTC 
GAGGACGACA CCGACGAGAA GCCGTTCTCG CGCGCGCAGC GCAGCGTCGT CTACCAGCGC 
GCGAAGAACG TCGCCGACAA CCGGCCGTAC GGTACCGAGC TCGACGTGAA GGCGGTCGCG 
CACGAATGGA TCAGCCATTC GCTCGCGCCG ACGAAGCTCG ACGGCCACGA TTTCCGGATT 
CGCGTCGGCG CGACGCGCAA GCAGCCTTAT GACATCTCGA TCTTCAACAT CTCGGCGATG 
AGCTTCGGCG CGCTGTCGGC GAACGCGATC CGCGCGCTGA ATCTCGGCGC GAAGCAAGGC 
GGCTTCGCGC ACGACACGGG CGAAGGCTCG CTGTCGAAGT ATCACCGCGA GCACGGCGGC 
GACATCATCT GGGAAATCGG CTCCGGCTAC TTCGGCTGCC GCCGCGGCGA CGGCACGTTC 
GATCCGGAGA AGTTCGCGAA ACAGGCGCGC GAGCCGCAGG TGAAGATGAT CGAGGTGAAG 
CTCTCGCAGG GCGCGAAGCC CGGCCACGGC GGCGTGCTGC CCGCCGCGAA GATCACGCCC 
GAGATCGCCG AGACGCGCGG CGTGCCGATG GGCAAGGATT GCGTGTCGCC CGCCGCGCAC 
TCGGCGTTCT CGACGCCGCG CGGGCTGCTC GAATTCGTCG ACCGGCTGCG CGAGCTCTCG 
GGCGGCAAGC CGACGGGCTT CAAGCTGTGC GTCGGCCATC CGTGGGAATT CTTCGGGATC 
GCGAAGGCGA TGCTCGAGAC GGGCATCGTG CCGGACTTCA TCGTCGTCGA CGGCGCGGAA 
GGCGGCACGG GCGCCGCGCC CCTCGAATTC ACCGATCACG TCGGCGTGCC GCTGCAGGAA 
GGGCTGCTGC TCGTGCACAA CACGCTCGTC GGGATCGGGC TGCGCGAACA GGTGAAGCTC 
GGCGCGAGCG GCAAGATCAT CACCGCGTTC GACATCGCGC GCACGCTCGC GATCGGCGCG 
GACTGGGTGA ACTCCGCGCG CGGCTTCATG TTCGCGGTCG GCTGCATCCA GGCGCAGCAC 
TGCCACACCG ACCGCTGCCC GACGGGCGTC GCGACGCAGG ACCCGGTGCG CCAGCGCGCG 
CTCGTCGTGC CGGACAAGGC CGATCGCGTC TACAACTTCC ATCGCAACAC GCTGCACGCG 
TTGCAGGAGC TCGTGCAGGC GGCGGGGCTG TCGCACCCGT CCGAGCTGCG CGCGCATCAC 
ATCGTGCAGC GCGTCGCACC GCACGAAGTC CGGCTGATGT CGCAACTGCT GAAGTATCTG 
GAGCCGGGCG CGCTGCTCAA CGGCGGCCAT TGCGGCTTCT CGCTGTACGA GACGTGGTGG 
CCGCTCGCGC GCGGCGATTC GTTCTCGCCC GGCGAAGGCG CGTACGCGCG CGTCGGCACG 
GGCGCGCCGG CGCGCGCGTA G

Protein sequence

MLSRRYLAMW CALALFAAAA VLAARHTISW LWIVPVAALV ALGLYDLNQD RHAILRNYPL 
WGHLRFLFEF IRPEIRQYFV EDDTDEKPFS RAQRSVVYQR AKNVADNRPY GTELDVKAVA 
HEWISHSLAP TKLDGHDFRI RVGATRKQPY DISIFNISAM SFGALSANAI RALNLGAKQG 
GFAHDTGEGS LSKYHREHGG DIIWEIGSGY FGCRRGDGTF DPEKFAKQAR EPQVKMIEVK 
LSQGAKPGHG GVLPAAKITP EIAETRGVPM GKDCVSPAAH SAFSTPRGLL EFVDRLRELS 
GGKPTGFKLC VGHPWEFFGI AKAMLETGIV PDFIVVDGAE GGTGAAPLEF TDHVGVPLQE 
GLLLVHNTLV GIGLREQVKL GASGKIITAF DIARTLAIGA DWVNSARGFM FAVGCIQAQH 
CHTDRCPTGV ATQDPVRQRA LVVPDKADRV YNFHRNTLHA LQELVQAAGL SHPSELRAHH 
IVQRVAPHEV RLMSQLLKYL EPGALLNGGH CGFSLYETWW PLARGDSFSP GEGAYARVGT 
GAPARA