Gene BURPS1710b_A2057 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_A2057
Symbol
ID	3693723
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007435
Strand	+
Start bp	2503657
End bp	2504679
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	73%
IMG OID	637732311
Product	transglutaminase domain-containing protein
Protein accession	YP_337208
Protein GI	76817297
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1305] Transglutaminase-like enzymes, putative cysteine proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.682428
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGGATGA CGACGCGGCC GCAGGCGAAC GCGAAGGCGC GCGCGCGCAA GGCGGCCGCG 
CGCGGGGAGC CGGCGCGCGG CGCGCTGCTG CGCGTCACGC ATGATACGCG CTATCGATAC 
GCGGCGCGCG TCGAATCCGC GCAGCATCAG GCGCGTCTGC GCCCGCTCGA GACGCCGCGG 
CAGCGCGTGA TCGAGTTCTC GCTCGAGATC GAGCCGCGCG CGGAAGGGCT CGTCGTCGAC 
ATCGATTCGT TCGGCAACGA GCGCGCTTCG TTCGCGCTCA ACCAGCCGCA CGAGGAGCTG 
TTCGTGCGCA GCCGCAGCGT CGTGCGCGTC ACGCCGCCCG CGCTGGCGGC GGGCAAGCGC 
GGCGAGCCGC CGCCCGCCGT CGCCGCGCCG CGCGACGGCT GCGCGAGCGC GTGGGAAGCG 
GTGCGTGAGC GCCTGACGTT TCGTGCCGGC CGCCCGTTCG ATCCGGCGAG CGAATTCGTG 
TTCGCTTCGC CGCACGTCGC ATGCCACTCC GATCTCGCCG CCTATGCGGC GGCGAGCTTC 
ACGCCGGGCC GGCCGCTCGT GCAGGCCGCG TGGGAGCTGA TGCGCCGCAT CCACGCGGAT 
TTCGCGTATG CGCCGAACAG CACCGACGTC GGCACGACCG CGCTCGATGC GCTCGCGCTG 
CGCCAGGGCG TGTGCCAGGA TTTCGCGCAC GTGATGATCG GCGCGCTGCG CTCGCTCGGG 
CTTGCCGCGC GCTACGTGAG CGGCTATCTG CTGACGCAGC CGCCGCCCGG GCAGCCGCGA 
TTGATCGGCG CGGACGCATC GCATGCGTGG GTCGAGGTCT ACGATCCCGC GTGGCCCGAG 
GACGGTGGCT GGCTGCCGCT CGATCCGACC AACGATCGCG CGCCCGGCGA CGATTACGTG 
ATGCTGTCGA TCGGCCGCGA CTACGCGGAC GTGACGCCGT TGCGCGGCGT CATTCGCGGC 
GGCGGGGCCG ATCAGGTGCT GACGGTCGGC GTGACGGTGG AGCCGCTCGA TTCGGCGTCC 
TGA

Protein sequence

MGMTTRPQAN AKARARKAAA RGEPARGALL RVTHDTRYRY AARVESAQHQ ARLRPLETPR 
QRVIEFSLEI EPRAEGLVVD IDSFGNERAS FALNQPHEEL FVRSRSVVRV TPPALAAGKR 
GEPPPAVAAP RDGCASAWEA VRERLTFRAG RPFDPASEFV FASPHVACHS DLAAYAAASF 
TPGRPLVQAA WELMRRIHAD FAYAPNSTDV GTTALDALAL RQGVCQDFAH VMIGALRSLG 
LAARYVSGYL LTQPPPGQPR LIGADASHAW VEVYDPAWPE DGGWLPLDPT NDRAPGDDYV 
MLSIGRDYAD VTPLRGVIRG GGADQVLTVG VTVEPLDSAS