Gene BURPS1106A_1962 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_1962
Symbol
ID	4901347
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	1928562
End bp	1929911
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	69%
IMG OID	640135192
Product	glycosy hydrolase family protein
Protein accession	YP_001066227
Protein GI	126455294
COG category	[R] General function prediction only
COG ID	[COG3979] Uncharacterized protein contain chitin-binding domain type 3
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.639701
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTGTCCC GCATCGTCCC GCGCGCGCTC GCGGCGGGCT GTCTGTTCGC GGCGGCGGGC 
GCGTCGCAGG CGGCGGGCGT GTACGCGCCC TACGTCGACG TGACGCTCTA CCCGACGCCG 
CTCGTCGACC AGATCGGCGT GCAGCAAGGC ATCCAGCAAT TCATGCTCGC GTTCGTCGTG 
TCGGGCGGCA ACCAGTGCAC GCCGTCATGG GGCGGCGTGC AGCCGATCGG CAACGGCGCG 
ACGGGCGATC TGCTCGACAA GATCGCGACG TCGGTCACCG CCTATCGCGC GAAGGGCGGC 
GACGTGGCGG TATCGTTCGG CGGCGCGGCC GGCCAACCGC TGATGCAGGC GTGCTCGAGC 
GTCGCCGCGC TGAAGGGCGC ATATCAGACC GTGATCGACA CGTACAGCCT CACGCACGTC 
GATTTCGACA TCGAAGGCGC GTCGCAGCAG GATTCGGCCG CCGTCGCGCG CAACTTCCAG 
GCGGTCGCGC AACTGCAAGC CGACTACGCG GCCAAAGGCA AGCCGCTGCA CGTGACGCTC 
ACGCTGCCGG CGATGCCCAC GGGCCTCGTG CAGGACGGCC TGAACGTGCT GAACGCGGCG 
CTCGCGAACA ACGTGACGCT CGACGCGGTG AACATCATGA CGATGGATTA CGGCCCGTCC 
GGCATCGACA TGGGCGCGGC CGCGATCAGC GCCGCGCAGG GCCTCTACTC GCAGCTCGAC 
ACCGCGTACA AGTCGGCCGG CAAGCCGCAG ACCGACGCGC AATTGAAGCA GCTCGTCGGC 
GTGACGCCGA TGATCGGCGT GAACGACGTC GCGGGCGAGA TCTTCACGCT CGCGAACGCG 
CAGAGCGTGC AGACGACGGC CGCGAACAAC AACTACGGCT TCGTCGGCAT CTGGTCGATC 
ACGCGCGACA AGGCATGCGA CGGCAGCTCG CAGTACGCGT CGCCGATCTG CTCGGGCGTC 
GCGCAGCAGC CGTACGCGTT CTCGTCGGTC TTCAAGCAAC TGGGCGGCCA TTGGGGCGCG 
GGCGTCACCC AGGACCCGAA CTACGGCGGC GGCTCGGACG GCGGCGGCAA GCCCCAGCCG 
GGCGCGCCGT GGTCGGCCAC GCAGGTCTAT ACGGCGGGCG CGACGGTCAC GTACCAGGGC 
ACGACCTATC AGGCCCAATG GTGGACGCAG GGCGACATTC CGGGGCAGGC GTCGGTGTGG 
AAGCCCGTCG GCGGCAACGT GCCGGCCTGG TCATCGACGA CCGCGTATCC GGGCGGCGCG 
TGCGTGACGT ATCAGGGCGC GAAGTATTGC GCGAAATGGT GGACGCAGGG CGACGTGCCG 
AGCGCGGGCG GCCCCTGGAC GCGAGCGTGA

Protein sequence

MLSRIVPRAL AAGCLFAAAG ASQAAGVYAP YVDVTLYPTP LVDQIGVQQG IQQFMLAFVV 
SGGNQCTPSW GGVQPIGNGA TGDLLDKIAT SVTAYRAKGG DVAVSFGGAA GQPLMQACSS 
VAALKGAYQT VIDTYSLTHV DFDIEGASQQ DSAAVARNFQ AVAQLQADYA AKGKPLHVTL 
TLPAMPTGLV QDGLNVLNAA LANNVTLDAV NIMTMDYGPS GIDMGAAAIS AAQGLYSQLD 
TAYKSAGKPQ TDAQLKQLVG VTPMIGVNDV AGEIFTLANA QSVQTTAANN NYGFVGIWSI 
TRDKACDGSS QYASPICSGV AQQPYAFSSV FKQLGGHWGA GVTQDPNYGG GSDGGGKPQP 
GAPWSATQVY TAGATVTYQG TTYQAQWWTQ GDIPGQASVW KPVGGNVPAW SSTTAYPGGA 
CVTYQGAKYC AKWWTQGDVP SAGGPWTRA