Gene BURPS1106A_A2038 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A2038
Symbol
ID	4904441
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	+
Start bp	2010722
End bp	2012155
Gene Length	1434 bp
Protein Length	477 aa
Translation table	11
GC content	72%
IMG OID	640145143
Product	hypothetical protein
Protein accession	YP_001076071
Protein GI	126456857
COG category	[S] Function unknown
COG ID	[COG3522] Uncharacterized protein conserved in bacteria
TIGRFAM ID	[TIGR03353] type VI secretion protein, VC_A0114 family

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGCACG ACGCATCACG AACCGGAACG AACGACATGG ACAACGTCTA TTGGCATCAG 
GGGATGCTGC TGCAACCGCA ACATTTTCAG TTGGCCGAAC TGCACCAGCA GTTCCGCTTC 
GAGCCGTGGC TCGCGTGCGG CCCGCCGCAT TTCTGGGGCG TCGGCGCGCT GTCGCTCGCG 
CAGGCCGCGA TCGATCGCCG CGTGGTCGAG ATCCGCTCGG CGCGCCTGCT GTTCGCCGAT 
CGCAGCTACG TCGAATATCC GGGCAACGCG GTCGTCGCCG CGCGCGCGTT CGATCCCGCG 
TGGCTCGACG AAGGCCGCGC GCTCGTCGCG CACGTCGCGC TCAGGCGGCT CGCGCGCGGC 
GCGAACAACG TGACGGTCGC GGCCGCGCCC GACGCGCTGC CCGACGCCCC GACGCGCTAC 
GCGACGCTGC CGTCCGCCGA GGAGGTCGCC GATCTGCATT CGGACCATCC GGGCGCGCCG 
GTGCGCACGC TCAAGCACGT GCTGAAGATC GTGTTCGAGC ACGAGCTCGA CGCGCTCGCC 
GCGCACGAAA CGATCCCGAT CGCGCGGATC GTGCGCGACG GCGAGCGCCT GCGGCTCGAC 
GACGATTTCG CGCCGCCCTG CTACGCGCTG TCGGGCTCGC GCACGCTGCT CGAGCGCGTG 
CGCTGCATTC GCGACGAGCT CGCGGGCCGC GCGCGGCAGT TGCAGCAGTA CAAGAATCCG 
CGCGAGATGC AACGCGCCGA ATTCGACGCG AGCTATGCGG CGTTCCTGCT CGCGCTGCGT 
TCGCTGAACC GCTTCGGCCC GCTGCTGTTC CATCTCGCCG AATGCGACGG GCAGCATCCA 
TGGACGGTCT ACGGCGTGCT GCGCCAACTC GTCGGCGAGC TGAGCGTGTT CTCCGAGCGC 
TTCGACATGC TCGGCGAGAC GCCCGATGCG CGCGGCGGCC TGCCGCCGTA CGACCACCGC 
GATCTGGGCG GCTGCTTCTC GCGCGCGCAC GCGCTGATCG GCCACCTGCT CGACGAAATC 
GCGGTGGGCC CGGACTGCGT CGCGACGTTC GAGCCCGACG GCCCGCAGCA GCCCGCGCAA 
CGCTCGGCGC AACTGCCGCC CGACGTGTTC GCGGATCGCC ACCAGATCTA TCTCGCGATC 
CGCAGCGCGC ACGATCCGGA CACGCTCGCG CAACGCTTCG CGCTCGGCGG CCGGATCGCG 
GCGACCGACG AAATGCCGCA GCTCACCGCG CTCGCGCTGC CGGGCGTCGA ACTCACCCGC 
CTGCCCGGCC CGCCGCCGCG GCTGCCGCGC CGCGGCGACG CGCGCTACTT CCGGATCGAG 
CAGGCCGGCC GCCCGTGGGA CGCGATCCGG CGTGACGGCC GCGTGTCGCT GCGCTGGGCC 
GACGCGCCGG ACGACCTGCA CGCGGAACTC GTCGCGGTGA GGCACACGCA ATGA

Protein sequence

MTHDASRTGT NDMDNVYWHQ GMLLQPQHFQ LAELHQQFRF EPWLACGPPH FWGVGALSLA 
QAAIDRRVVE IRSARLLFAD RSYVEYPGNA VVAARAFDPA WLDEGRALVA HVALRRLARG 
ANNVTVAAAP DALPDAPTRY ATLPSAEEVA DLHSDHPGAP VRTLKHVLKI VFEHELDALA 
AHETIPIARI VRDGERLRLD DDFAPPCYAL SGSRTLLERV RCIRDELAGR ARQLQQYKNP 
REMQRAEFDA SYAAFLLALR SLNRFGPLLF HLAECDGQHP WTVYGVLRQL VGELSVFSER 
FDMLGETPDA RGGLPPYDHR DLGGCFSRAH ALIGHLLDEI AVGPDCVATF EPDGPQQPAQ 
RSAQLPPDVF ADRHQIYLAI RSAHDPDTLA QRFALGGRIA ATDEMPQLTA LALPGVELTR 
LPGPPPRLPR RGDARYFRIE QAGRPWDAIR RDGRVSLRWA DAPDDLHAEL VAVRHTQ