Gene BURPS1710b_2109 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_2109
Symbol	chiC
ID	3691184
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007434
Strand	-
Start bp	2305739
End bp	2307100
Gene Length	1362 bp
Protein Length	453 aa
Translation table	11
GC content	69%
IMG OID	637728565
Product	glycosy hydrolase family protein
Protein accession	YP_333504
Protein GI	76810523
COG category	[R] General function prediction only
COG ID	[COG3979] Uncharacterized protein contain chitin-binding domain type 3
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATTTCA GCATGTTGTC CCGCATCGTC CCGCGCGCGC TCGCGGCGGG CTGTCTGTTC 
GCGGCGGCGG GCGCGTCGCA GGCGGCGGGC GTGTACGCGC CCTACGTCGA CGTGACGCTC 
TACCCGACGC CGCTCGTCGA CCAGATCGGC GTGCAGCAAG GCATCCAGCA ATTCATGCTC 
GCGTTCGTCG TGTCGGGCGG CAACCAGTGC ACGCCGTCAT GGGGCGGCGT GCAGCCGATC 
GGCAACGGCG CGACGGGCGA TCTGCTCGAC AAGATCGCGA CGTCGGTCAC CGCCTATCGC 
GCGAAGGGCG GCGACGTGGC GGTATCGTTC GGCGGCGCGG CCGGCCAACC GCTGATGCAG 
GCGTGCTCGA GCGTCGCCGC GCTGAAGGGC GCGTATCAGA CCGTGATCGA CACGTACAGC 
CTCACGCACG TCGATTTCGA CATCGAAGGC GCGTCGCAGC AGGATTCGGC CGCCGTCGCG 
CGCAACTTCC AGGCGGTCGC GCAACTGCAG GCCGACTACG CGGCCAAAGG CAAGCCGCTG 
CATGTGACGC TCACGCTGCC GGCGATGCCC ACGGGCCTCG TGCAGGATGG CCTGAACGTG 
CTGAACGCGG CGCTCGCGAA CAACGTGACG CTCGACGCGG TGAACATCAT GACGATGGAT 
TACGGCCCGT CCGGCATCGA CATGGGCGCG GCCGCGATCA GCGCCGCGCA GGGCCTCTAC 
TCGCAGCTCG ACACCGCGTA CAAGTCGGCC GGCAAGCCGC AGACCGACGC GCAATTGAAG 
CAGCTCGTCG GCGTGACGCC GATGATCGGC GTGAACGACG TCGCGGGCGA GATCTTCACG 
CTCGCGAACG CGCAGAGCGT GCAGACGACG GCCGCGAACA ACAACTACGG CTTCGTCGGC 
ATCTGGTCGA TCACGCGCGA CAAGGCATGC GACGGCAGCT CGCAGTACGC GTCGCCGATC 
TGCTCGGGCG TCGCGCAGCA GCCGTACGCG TTCTCGTCGG TCTTCAAGCA ACTGGGCGGC 
CATTGGGGCG CGGGCGTCAC CCAGGACCCG AACTACGGCG GCGGCTCGGA CGGCGGCGGC 
AAGCCCCAGC CGGGTGCGCC GTGGTCGGCC ACGCAGGTCT ATACGGCGGG CGCGACGGTC 
ACGTACCAGG GCACGACCTA TCAGGCCCAA TGGTGGACGC AGGGCGACAT TCCGGGGCAG 
GCGTCGGTGT GGAAGCCCGT CGGCGGCAAC GTGCCGGCCT GGTCATCGAC GACCGCGTAT 
CCGGGCGGCG CGTGCGTGAC GTATCAGGGC GCGAAGTATT GCGCGAAATG GTGGACGCAG 
GGCGACGTGC CAAGCGCGGG CGGCCCCTGG GCGCGAGCGT GA

Protein sequence

MNFSMLSRIV PRALAAGCLF AAAGASQAAG VYAPYVDVTL YPTPLVDQIG VQQGIQQFML 
AFVVSGGNQC TPSWGGVQPI GNGATGDLLD KIATSVTAYR AKGGDVAVSF GGAAGQPLMQ 
ACSSVAALKG AYQTVIDTYS LTHVDFDIEG ASQQDSAAVA RNFQAVAQLQ ADYAAKGKPL 
HVTLTLPAMP TGLVQDGLNV LNAALANNVT LDAVNIMTMD YGPSGIDMGA AAISAAQGLY 
SQLDTAYKSA GKPQTDAQLK QLVGVTPMIG VNDVAGEIFT LANAQSVQTT AANNNYGFVG 
IWSITRDKAC DGSSQYASPI CSGVAQQPYA FSSVFKQLGG HWGAGVTQDP NYGGGSDGGG 
KPQPGAPWSA TQVYTAGATV TYQGTTYQAQ WWTQGDIPGQ ASVWKPVGGN VPAWSSTTAY 
PGGACVTYQG AKYCAKWWTQ GDVPSAGGPW ARA