Gene BURPS1710b_A0635 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_A0635
Symbol	hipA
ID	3693459
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007435
Strand	+
Start bp	834824
End bp	836692
Gene Length	1869 bp
Protein Length	622 aa
Translation table	11
GC content	71%
IMG OID	637730888
Product	hipA protein
Protein accession	YP_335793
Protein GI	76819740
COG category	[R] General function prediction only
COG ID	[COG3550] Uncharacterized protein related to capsule biosynthesis enzymes
TIGRFAM ID	[TIGR03071] HipA N-terminal domain

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.427035
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCCGCT CATCCGAAAT ACAGATTCAA CCTTGTAAAT TCTATTTACA GTGTATAAAC 
TGTTTTTCTC GCATACAGGC GAAAATTTGT ATTCCAACCA GGTGCGCACA TGGCCATCCT 
CATCGAGCAC GAGATCAAGA CACTCGGCCA GCTGCGGCCG ATTCTGCGCG GCTTCCGCAA 
ATCGGCCGGA TTGACGCAGG CGATACTCGC GAGCCGCCTC GGCGTCACGC AGCAGACCTA 
CGCGCAGTTC GAGGCGAACC CGGCGTCGGC GAGCGTCGAG CGGCTGTTCA AGGTGCTGCG 
CGCGCTCGAC ATCGAACTCA CGCTCACGCT CACGCAGGTC TACGCCGCGC CCGCGGGCAA 
GGACAAGGGC GAGGTTGCGA AGACGGCCGC AGGCGCGCGC GCGCGCGCGG GCGCGCGACG 
TGCCGTGCCG CCCGCGTCCG CGCCCGCTCC GAGCGCCGCC GGGCGCGCGC CCCGCCCCGC 
CCGCAAGCGC GCCGCCCCGA AAAAGCGGGA GGACTGGTGA GCGCCCGCCG CGCACGCGCG 
ACGCGCCTGC ACCTGTGGAT GAACGGCCTG CCCGTCGGCT ACTGGGAGCA CGCGCGCGAC 
GGCGAGCGCC TTGTCTACTT CGACGAATGG ATCGGCGATC CGCAAGGCCG GCCGCTGTCG 
CTGTCGCTGC CGTTCACGCC GGGCAACCAG CCGTATCGCG GTCGGCTCGT CAGCGATTAT 
TTCGACAACC TGCTGCCCGA CAGCGAGCCG ATCCGCCGGC GAATCGCGAT GCGCTACCGC 
ACGGGCGGCA CGTCCGCGTT CGCGCTGCTC GCGACGCTCG GCCGCGATTG CGTCGGCGCG 
CTGCAGATGC TGCCGCCCGA CGAAGCGCCG GACGACATCG AACGCATCCG CGGCCACGCG 
CTCGCCGACG CGGACATCGC GCGCCTGCTG CGCGAAGTCA CGTCCGCGCC GCAGGCCGGC 
CGGCACGCGC CGCTCGACGA TCTGCGCCTG TCGATCGCCG GCGCGCAGGA GAAGACCGCG 
CTGCTGCGCC ATCGCGGCCG CTGGCTGCTG CCCGAAGGGA GCACGCCGAC CACGCACATC 
CTGAAGCTGC CGCTCGGGCT CGTCGGCAAC CGGCGCGCCG ACATGCGCAC GTCGGTCGAG 
AACGAATGGC TGTGCGCGCG GATCGTCGCC GCGTACGGGT TGCCCGTCGC GCGCTGCGAC 
ATCGCTCAGT TCGACGATCA GAAAGCGCTC GTCGTCGAGC GCTTCGACCG CCGGCCGTCG 
CGCGACGCAC GCTGGCTCCT GCGGCTGCCG CAGGAAGACA TGTGCCAGGC AACCGGCACG 
TCCGCGCTCG ACAAATATCA GGCCGACGGC GGCCCCGGCA TCGAGACGAT CATGGAAGTG 
CTCGCCGGCT CCGAGCACGC GCGGGACGAC CGCCGCGCGT TCTTCGCGGC GCAGATCGTG 
TTCTGGCTGC TCGCCGCGAC CGACGGCCAC GCGAAGAACT TCAGCATCGC GCACCTGCCC 
GGCAACCGCT ACCGTTCGAC GCCGCTTTAC GACGTGCTGT CCGCGCATCC GGTCATCGGC 
CGGGGCGCGA ACCAGTTGCC CGCGCAGCGC GCGCGGCTCG CGATGGGCGT GCGCGGCAAG 
CACATCCACT ATCCGCTGCA CCAGATCCGG CGGCGGCACT GGATCGCGCA GGGCCAGCGC 
GTCGGCTTCG CGCCCGCCGA CGTCGACGCG CTGATCGACA CGCTGACCGC GCGCACCGCG 
GGCGTCGTCG ACGCGGTGTC GGCGCGGCTG CCGCGCGATT TTCCGCGCGA CGTCGCCGAT 
GCGATCTTCA GCGGAATGCT CGGCCTGAGC GCAAGGCTCG CCGGCGACGC GGCCGCGCGC 
GCACCATGA

Protein sequence

MPRSSEIQIQ PCKFYLQCIN CFSRIQAKIC IPTRCAHGHP HRARDQDTRP AAADSARLPQ 
IGRIDAGDTR EPPRRHAADL RAVRGEPGVG ERRAAVQGAA RARHRTHAHA HAGLRRARGQ 
GQGRGCEDGR RRARARGRAT CRAARVRARS ERRRARAPPR PQARRPEKAG GLVSARRARA 
TRLHLWMNGL PVGYWEHARD GERLVYFDEW IGDPQGRPLS LSLPFTPGNQ PYRGRLVSDY 
FDNLLPDSEP IRRRIAMRYR TGGTSAFALL ATLGRDCVGA LQMLPPDEAP DDIERIRGHA 
LADADIARLL REVTSAPQAG RHAPLDDLRL SIAGAQEKTA LLRHRGRWLL PEGSTPTTHI 
LKLPLGLVGN RRADMRTSVE NEWLCARIVA AYGLPVARCD IAQFDDQKAL VVERFDRRPS 
RDARWLLRLP QEDMCQATGT SALDKYQADG GPGIETIMEV LAGSEHARDD RRAFFAAQIV 
FWLLAATDGH AKNFSIAHLP GNRYRSTPLY DVLSAHPVIG RGANQLPAQR ARLAMGVRGK 
HIHYPLHQIR RRHWIAQGQR VGFAPADVDA LIDTLTARTA GVVDAVSARL PRDFPRDVAD 
AIFSGMLGLS ARLAGDAAAR AP