Gene BURPS1710b_A0528 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_A0528
Symbol
ID	3693131
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007435
Strand	+
Start bp	713890
End bp	715026
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	70%
IMG OID	637730782
Product	Hep_Hag family protein
Protein accession	YP_335687
Protein GI	76818786
COG category	[U] Intracellular trafficking, secretion, and vesicular transport [W] Extracellular structures
COG ID	[COG5295] Autotransporter adhesin
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGACGCGG TCATCCGAAA CGCCGTCAAT CTGGCGCCCG ATGCGAACGG GGACTTCTCC 
GGCCGCTCGG CGATGCCGAT CGAAATGGCC GCGAACGCCG CGCTGAGATC GCTGAAGAAA 
AATCCGGGCG ACGCCGGCCA TGCCGCTCCG GCATACCTGC CTGCCGAGCG GATCGGCCAG 
TTGCGGGAAA AGGTCCGAAG GACCATCGAG GCGCTCGAAT CGAACCGCCC ACCGAAACCG 
CAGCCGCGGT CGACACCACC GCAATCGACG CCACCCAAGC CGACGCAGCA CCCGACCGCG 
CCCAACCCGA ACGTACCCGA CGCATCGACG CCTGATGCAT CGACGCCTGA CGCTTCGACG 
CCCGACGCAT CGACGCCCGA CGCATCGACG CCCAGCCGAC CTGCCCCTGC CCCCCGAGCG 
GGCACGGGCG CGCCCGCTGC TTCGGCGGCG ACGCGCGCCC CCGCCTTTGC AAACCGCGTG 
CGCAAGCCGA ATCCGGCTAT GCCCGCCGCG TCGTCGCATG CGATCGCGAG CGACTTCGCG 
TCGAGCAACG CGTTCGCGAT CGGCGACGAC TCGACCGCCG TCGGAGCGCA AGCGATCGCG 
TTCAGCGAGC AATCGATCGC CATAGGCTCG CGCGCGATTG CCGCCGGCGC CCGTTCGATC 
GCCGTCGGCA CGGACGCGAC AGCAGCCGCC CCCGATTCGG TCGCCCTCGG CTCGGGCTCC 
ATCGCCGAAC GCGAAGGCAC GGTGTCCGTC GGCAGAGACG GCCACGAACG CCAGATCACC 
CATGTCGCAT CCGGCACCGA GCCCACCGAC GCCGTCAACG TCACGCAACT GCGCGCGGCA 
ATGTCGAACG CCAACGCGTA CACGAACCAG CGCATCGGCG ATCTTCAGCA GAGCATCACC 
GACACCGCGC GCGACGCGTA TTCCGGCGTC GCCGCCGCGA CCGCGCTGAC GATGATTCCC 
GATGTCGACC GCGACAAGAG GGTGTCGATC GGCGTCGGCG GCGCGGTCTA CAAGGGCCAT 
CGCGCCGTCG CGCTCGGCGG CACCGCGCGC ATCAACGAAA ACCTCAAGGT GCGGGCGGGC 
GTCGCGATGA GCGCGGGCGG CAATGCCGTG GGCATCGGCA TGAGCTGGCA ATGGTAA

Protein sequence

MDAVIRNAVN LAPDANGDFS GRSAMPIEMA ANAALRSLKK NPGDAGHAAP AYLPAERIGQ 
LREKVRRTIE ALESNRPPKP QPRSTPPQST PPKPTQHPTA PNPNVPDAST PDASTPDAST 
PDASTPDAST PSRPAPAPRA GTGAPAASAA TRAPAFANRV RKPNPAMPAA SSHAIASDFA 
SSNAFAIGDD STAVGAQAIA FSEQSIAIGS RAIAAGARSI AVGTDATAAA PDSVALGSGS 
IAEREGTVSV GRDGHERQIT HVASGTEPTD AVNVTQLRAA MSNANAYTNQ RIGDLQQSIT 
DTARDAYSGV AAATALTMIP DVDRDKRVSI GVGGAVYKGH RAVALGGTAR INENLKVRAG 
VAMSAGGNAV GIGMSWQW