Gene BURPS1106A_2010 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_2010
Symbol
ID	4900051
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	1971924
End bp	1973801
Gene Length	1878 bp
Protein Length	625 aa
Translation table	11
GC content	71%
IMG OID	640135241
Product	putative non-ribosomal peptide synthase
Protein accession	YP_001066276
Protein GI	126454659
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3319] Thioesterase domains of type I polyketide synthases or non-ribosomal peptide synthetases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCATGTTT CGACCGATAC GTCCGCCGAA GCCCATTCAC CGGCGCCGAA TTCACTCGAT 
ATGTCAGACA GTGACGCACT GCGCCGGATT GCCGAAGCCG TCGACGGCGG TGCGGCGAAC 
ATCGAGCGAA TCGTTCCGCT CGCCCGTGCG CGCGAGCGTA TGCCGACGCG GCCTCGGCTC 
GAGCGGTGCG GCGGCGGGCG AGTGACGGCG GCGCACATCA CGCTCGACTC GCGTGCGCGT 
CTCGATGCGT TGCTGCACGC ATTGCAACGC GCGATCGACC AGAACGCGGA CCTGCGAACG 
TGCATTTTGG GGGCGTGCCT GCGGCGGCCG ATGCAAGTCA CGCTTCGCGA GGTTCGCCTG 
CGAGTGCACG CCGCGACGCT CGACCCCGAC CTCGATCCCG CCGCGCAGTT GGCCGCGCTG 
AGCACCGGGC CCGGCATGCG CATCGACATG CAACGCCCGC CGTGGGTGCT CGCGTGCATC 
GCGCGCATTC CGGGCAGCGG GCAATGGCTG CTGCGGCTCG TGGCAGCCCC GATCGCGGCC 
GGATTCGACG CGCTCGACGC GCTGCTTCGC GAGACGGTGA TTCACGGCGA CCGGGAGCCC 
GGGCCGGCGC CGTTTCACTG GACTGTGGAA ACGGCTGTTG AATCGTGCGG AGGCGAACCT 
GCGTCGTTGC CGACCGCGGG CGCGGTTTGG CCGTCGAACG ACGTATCACG CGCTTGCGAT 
CCGGATGCCG CGTCGTGCGT CGAGGCGCGC ATCGCCGCGA TCGCGTCCGA TCTGCCGGGC 
GTCGTGCATG GCGGACCACG AGACGATTTG CGCGCGCTCG GACGAACGCC GTTGCAGGCG 
CTTCGACTCG CGCGCCGTAT CCGCGACGCA CTGGGCGTGA CCGTACCGGT CGAGTCGATC 
CTCGCGAGTC CGACCATCGT CGAGCTTGCC GGGTACGTCG AGCAATTGCG CTCGCGGGAC 
GTCCGCGACG GCGCTGCGCC CGTGTCGATC GGCGAAAAAC CGGCGGACGC GGATGCTCGG 
GCACAGGCGC AGGCGGATAC GGATACGGCG CACACCGATT GCCTGATCGT CATTCAAGCA 
GGCGGCGCCG AACAAGCGCC GGTGTTCTGC ATCCCGGGCG CGGGGGGCAG CGTCGCGTCG 
TTCGTTGCGC TTGCGAGCAT GCTGCGCGCC GACATACCGG TATACGGCTT GCAGCCTCGC 
GGGCTGGACG GCCTGGGGCC GCCGGACCGG TCCGTCGAAG CGGCTGCGCG CCGGTACGCG 
CGGGCCATTC TGGATGCCGC CCCGCCCGGG CCGCCGCGCA TCGTCGGCCA CTCGTTCGGC 
GGCTGGATCG CGCTCGAGAC AGCGCGGCTG CTGGACGGCA TGGGAGCGCG CTGCGCCCCG 
CTCGTCCTGC TCGATTCGAA TCCGCCGCCC GCGTCACAGG CCTGGCGCGC GCCTTCCGAG 
GCAGACATGC TGCGCACGCT CGTCGGCCTG CTCGAGCAGG CCGCGGGCGG CGCCCCATCC 
GGGATCGGCG ACGAAGAAAT CGCCCGTTGC GCGGCAGCGG GCGAGGATGC GCGGGATGCG 
CTCGTCCACG CCTGCATGGT GAGGACCGCC CTGCTGCCGC CGCGCGCGCC GGTCGAAGCG 
GTGCGGCACC TGCGGCGGGT ATTCGAAGCC CATTCGAGCA CCCGCTACGC GCCGGGCGGC 
CGATACGCGG GCGACGCAAC GGTGATCGTC GCCAACGGCG ATCGCGACGC GGGCGAGATG 
GTGCCGGCGT TCGGATGGGC CGCGCTGATC GAGCGAGTCG AGGTGGCCGT GACGCCGGGC 
AATCACATGA GCATGCTCGC GGCGCCGTAT GTTCGTCACG TCGCGCTGAC GATGAAGACG 
GTATGGCGCA TGATCTGA

Protein sequence

MHVSTDTSAE AHSPAPNSLD MSDSDALRRI AEAVDGGAAN IERIVPLARA RERMPTRPRL 
ERCGGGRVTA AHITLDSRAR LDALLHALQR AIDQNADLRT CILGACLRRP MQVTLREVRL 
RVHAATLDPD LDPAAQLAAL STGPGMRIDM QRPPWVLACI ARIPGSGQWL LRLVAAPIAA 
GFDALDALLR ETVIHGDREP GPAPFHWTVE TAVESCGGEP ASLPTAGAVW PSNDVSRACD 
PDAASCVEAR IAAIASDLPG VVHGGPRDDL RALGRTPLQA LRLARRIRDA LGVTVPVESI 
LASPTIVELA GYVEQLRSRD VRDGAAPVSI GEKPADADAR AQAQADTDTA HTDCLIVIQA 
GGAEQAPVFC IPGAGGSVAS FVALASMLRA DIPVYGLQPR GLDGLGPPDR SVEAAARRYA 
RAILDAAPPG PPRIVGHSFG GWIALETARL LDGMGARCAP LVLLDSNPPP ASQAWRAPSE 
ADMLRTLVGL LEQAAGGAPS GIGDEEIARC AAAGEDARDA LVHACMVRTA LLPPRAPVEA 
VRHLRRVFEA HSSTRYAPGG RYAGDATVIV ANGDRDAGEM VPAFGWAALI ERVEVAVTPG 
NHMSMLAAPY VRHVALTMKT VWRMI