Gene BURPS1106A_2414 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_2414
Symbol
ID	4901526
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	2377709
End bp	2378923
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	72%
IMG OID	640135642
Product	TPR repeat-containing protein
Protein accession	YP_001066674
Protein GI	126452003
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.460414
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAGC TTCTCGCAGC CGTCGGATTG TCGCTGATCC TCCTGTCGGC CGCCGCGAAC 
GCGGCGGTGC CGTCGCTGCA ACAAATCCAG CAATCGATCG CGCAAGGCAA CTGGCAGCGC 
GCCGATGCGC AGCTCTCGCA AGTGATCGAC GCGTACCCGG ACAACGCGCG CGCCCGCTAT 
CTGTACGGCC AGGTGCTCGA CCGCGAAGGC CGCCCCGCCG AGGCGCTCGC GCAGATCGAA 
CGGGCGAAGT CGCTCGATCC GCAACTGCGC TTCACCGATC CGTCGCGCTT CGCGCAGACT 
GAAGCGCGCG TGCGGGCCGA CGCGCGCCGC GCGACGGCCG CGCAGGACTC GCGCTCGGCG 
ACCTCGGGCG GCATGCTCGC CGCGCCGCAG GCGCCGGCCC AGGCCCGCGC GCCATTCTCC 
GCCGCCCCCG TCGCGCCCGC CGCGCCCGTG CATCGCGGCC CGTCGGTGGG TATGTGGATC 
GGCTTCGCGG TGCTGATCGG CGTGATCGTG ATCGTGCTGC GCAAAACGTT GCGCCGCGCG 
CGCTCGACGG ACGATCAGCG CGCCGACGAC GAACGCCGCG CGCAGTTGAA GCGCGCAACC 
GACATCCTCA ACGAAGTGCG TCCGCTCAAG CTCGACGCGC GGCTGTCGAC GGCGCCGGGC 
GCCGCCGCGC TCAACGGCGA GATCGAGGGG CTCGAAGCCC AGGCGCGCGA GCTCGTCGAG 
ACCCTGTCGA ACGGCAAGAA TCCCGCGCCG CCGTACCGGC TCGACGAGTT GGAGAAACAG 
TTCGCCAGCC TGAAGGCGCG CGTCGAAGGG CGCCCGGATC CGAACGCGGC CGCGCCGGGC 
GGGCCTGGCC AAACGGGCTC GGTATTTGCT CAGGAGGCCG ATCGGTTGAC GGGGGCGCAG 
GGCCAGCCGC CCTACTCGCC GTATCCGCCG CAGCCGCAAC AGCCGCCGCC CGTCGTGATC 
CAGCAAGGCG GCGGCGGCTT CGGCGGCGGC ATGGGCGGGC TGCTCACGGG CGTCCTGCTC 
GGCCAGGCGA TGTCGCACGG CCGCGACCGC GTGATCGAGC GCGACGTGAT CGTCGACGAC 
GAAGCGCGGC GCCGCGCGGG CGCCGATCCC GGCATCGACT TCGGCCAGGG CGACAGCTGG 
GACAGCGGCG GCTCGGACGG CGGCGGGAGC ATCGATCTCG GCAGCAGCGG CGACGATTGG 
AGCAACAACG GTTGA

Protein sequence

MKKLLAAVGL SLILLSAAAN AAVPSLQQIQ QSIAQGNWQR ADAQLSQVID AYPDNARARY 
LYGQVLDREG RPAEALAQIE RAKSLDPQLR FTDPSRFAQT EARVRADARR ATAAQDSRSA 
TSGGMLAAPQ APAQARAPFS AAPVAPAAPV HRGPSVGMWI GFAVLIGVIV IVLRKTLRRA 
RSTDDQRADD ERRAQLKRAT DILNEVRPLK LDARLSTAPG AAALNGEIEG LEAQARELVE 
TLSNGKNPAP PYRLDELEKQ FASLKARVEG RPDPNAAAPG GPGQTGSVFA QEADRLTGAQ 
GQPPYSPYPP QPQQPPPVVI QQGGGGFGGG MGGLLTGVLL GQAMSHGRDR VIERDVIVDD 
EARRRAGADP GIDFGQGDSW DSGGSDGGGS IDLGSSGDDW SNNG