Gene BURPS1106A_2042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_2042
Symbol
ID	4902932
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	2024691
End bp	2025782
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	68%
IMG OID	640135272
Product	hypothetical protein
Protein accession	YP_001066307
Protein GI	126451937
COG category	[S] Function unknown
COG ID	[COG3535] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.17375
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGACGCA TCCTGTCTTC GAAGGACGTT GAAGCCGCCG TCAAGGGCGG CTCGGTTTTC 
GCATGCGGCG GCGGCGGCTG GGCCGACCAC GGCCGCGAAC TCGGCATGCT CGCGGTCACG 
ATCGGCCGCC CCGAACTGGT CGCCATCGAC GAATTGCCGG ACGACGCATG GATCGCCACG 
GCCGCCGCAA TCGGCGCGCC GGGCGGCCTC ACCGACTGGC AAATGCTCGG CGCCGACTAC 
GTGAAGGCCG CTCAGCTCGT GCAGGAAGCG CTCGGCGCAC CGCTCGCGGG GCTCATCATC 
GGGCAAAACG GCATGTCGAG CACGCTTAAC GCGTGGCTGC CGTCCGCGCT GCTCGGCGCC 
AAGGTCGTCG ACGCGGTCGC CGATCTGCGC GCCCATCCGA CCGGCGACAT GGGCTCGCTC 
GGTCTCGCGT CGAGCTCCGA ACCGATGATC CAGGCAGCCG CCGGAGGCAA CCGCGCGAAG 
CATGCGTACA TGGAAGTCGT CGTGCGCGGC GCGACCGCCA AGGTATCGCC GGTATTGCGC 
AAGGCCGCCG ACATGGCCGG CGGCTTCATC GCGAGCTGCC GCAACCCCAT CCGCGCATCG 
TACGTGCGCC GGCATGCGGC GCTCGGCGGC ATCAGTCGCG CGCTCGCGCT CGGCGAAGCA 
ATCATCGACG CCGAGCGGCG CGGCGGCAGC GCGGTGATCG ATGCGATCTG CGCAGCCACG 
CAAGGCGAGA TCATCGTGAG CGGCAAAGTC GAGCGCAATA CGCTCGCCTA CACGCGCGAG 
GCGTTCGACG TCGGACTCGT CTATCTCGGC GAGGGCGCCA AGCGCGCGGT CATTCATGTG 
ATGAACGAAC ACATGGCGGT AGACGACGCG CACGGCGAGC GGATCGCGAC CTACCCCGAC 
GTGATCACGA CGCTCGACAG CGACGGCCGC CCTGTCAGCG CCGGGCAGTT AAAGGAAGGG 
ATGGAGATTC ACGTGCTGCG GGTGACGAAG ACACACATTC CGCTGTCGTC GTCGGTGTTC 
GATCCCGCGA TCTACCCGCC GGTCGAAACC GCGCTCGGCA TCTCGATCGC CGACTATGCG 
CTCGCCCGCT GA

Protein sequence

MGRILSSKDV EAAVKGGSVF ACGGGGWADH GRELGMLAVT IGRPELVAID ELPDDAWIAT 
AAAIGAPGGL TDWQMLGADY VKAAQLVQEA LGAPLAGLII GQNGMSSTLN AWLPSALLGA 
KVVDAVADLR AHPTGDMGSL GLASSSEPMI QAAAGGNRAK HAYMEVVVRG ATAKVSPVLR 
KAADMAGGFI ASCRNPIRAS YVRRHAALGG ISRALALGEA IIDAERRGGS AVIDAICAAT 
QGEIIVSGKV ERNTLAYTRE AFDVGLVYLG EGAKRAVIHV MNEHMAVDDA HGERIATYPD 
VITTLDSDGR PVSAGQLKEG MEIHVLRVTK THIPLSSSVF DPAIYPPVET ALGISIADYA 
LAR