Gene BURPS1710b_A2054 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_A2054
Symbol
ID	3693595
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007435
Strand	+
Start bp	2496315
End bp	2497271
Gene Length	957 bp
Protein Length	318 aa
Translation table	11
GC content	72%
IMG OID	637732308
Product	transglutaminase-like superfamily protein
Protein accession	YP_337205
Protein GI	76819058
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1305] Transglutaminase-like enzymes, putative cysteine proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCCTTG CCATCCGCCA CATCTCGCGC TTCCGATTCG ACGAACACGC GCCGCATGTG 
CTGCAGCGTC TGCGGCTGCG GCCGCAAAGC GGCCCGAGCC AGACCGTGCG CGCGTGGCAG 
GTGACGATCG ACGGCGTCGA GCCGACGCTC ACTTACGCGG ACGGCCTCGG CAATCGCGTC 
GATCTCGTGC GGCACGAGCG CGACAAGCCG GAGTTCGCGA TCGTCGCGGC GGGCGTCGTC 
GAGACGCAGG ATCGCGCCGG CATTCTCGGC CATATCGATG CGTATGCGCC GCCCTGGATC 
CACGAGCGCA CGACCGATCT GACGCGCGCG GGCGAGGCGA TCCGCGCGCT CGCCGAGGCG 
CTGCCGATCG AGCACAAGAG CCTCGACGCG CTGCATTGGC TGATGACCGA GGTGCACGGC 
CGCGTCGCCT ACGAGCCGCG CGCGCAGACC GCGCCGCGCG ACGCGGAGGC CGCGCTGCGA 
AGCGGTGCCG GCACGAGCCG CGATCATGCG CACGTGTTCG TCGCGGCGGC GCGCGCGCTG 
CGGATTCCGG CGCGCTACGT GTCCGGCTAT CTGTTGACGG ACGGCTCGAT GCAGCGGATC 
GCGGAGGCGC TTCATCAGGC GAGCGGCGCC GCGCAACAGG CGATGCAGGT GCGGCGCGGC 
GCGCACGACG CGCCCAGCGC GCCCGCGGCG CCCGACGATG CGTCGCGCCG CACGGGCGTC 
GCGATGCAGG AGGCCGCGGT CGCGACGCAG CCGCAATCGG GCCACGCGTG GGCCGAGGCA 
TACGTCGAAG GGCTCGGCTG GGTCGGCTTC GATCCGTTCA TGAACCGCTG TCCGGACGAG 
CGCTACGTAC GCATCGCGGC GGGTCTCGAC TATCGCGACG CGATGCCGGT GTACGGCCCG 
GGCGCGCAGC CGCTCGGCGT CGAGATCAGC GTGATCCAGT CCCCGGAACT CGTCTGA

Protein sequence

MRLAIRHISR FRFDEHAPHV LQRLRLRPQS GPSQTVRAWQ VTIDGVEPTL TYADGLGNRV 
DLVRHERDKP EFAIVAAGVV ETQDRAGILG HIDAYAPPWI HERTTDLTRA GEAIRALAEA 
LPIEHKSLDA LHWLMTEVHG RVAYEPRAQT APRDAEAALR SGAGTSRDHA HVFVAAARAL 
RIPARYVSGY LLTDGSMQRI AEALHQASGA AQQAMQVRRG AHDAPSAPAA PDDASRRTGV 
AMQEAAVATQ PQSGHAWAEA YVEGLGWVGF DPFMNRCPDE RYVRIAAGLD YRDAMPVYGP 
GAQPLGVEIS VIQSPELV