Gene BURPS668_A3126 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A3126
Symbol
ID	4888889
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	-
Start bp	2965529
End bp	2966665
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	71%
IMG OID	640133062
Product	mipA family protein
Protein accession	YP_001064117
Protein GI	126444960
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3713] Outer membrane protein V
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.0524278
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGCGATA CGCGACACGC GCCGCGCGCG CGCCTCGCGT CGATGGCGGC GCGTGCGCTC 
GCGTGCGCGC GCCGCTGCCG CCGCTCGAGC GAGACAGGCG CGGATGCGCC GAGCGATGCG 
CGCCGGCCAT TGCCCGCCGG GGCGGCGGTG CGGCTTGCCG CGCCGTGTGC CGGCCGCGCG 
CGACTTTCGC GCGAAAACGC GCAGTACCGA CTACAACGCG AACAAAGAGG ACAGCACATG 
AGCGACGCAC GAGCCGTTTC GATCCGGGGA ACCGCCGCTG TGCGCGACGC GGCGGCGCGC 
AGGCGCACCG CGCGCGGCAT CGTCTGCGCG GCGTGCGCGG CGGCGGCCGT ATCCGCCCAC 
GCGCAGACAC CATCGCCGCT CGGCGAGTGG CAGTATTCGG CCGGCGTGCC GCTCGACAAG 
CTCTTCAATC CGAACCCGCA GACATGGCAG ATCTCGGTCG GCGCGGCCGC GACGCTGCAG 
CCGCGCTACG ACGGCTCGAA CCAGTACCGG CCGATGGCCG GGCCGACCTT CGACGCCCGC 
TATCGCGACC TGTGGTTCGT GTCGACGGGC GAGGGAATCG GCGTCAACGT GCTGCGCGGG 
CCGAACTGGC GCGCGACGCT GTCGGCGGGC TATGACCTCG GCCGCCGCGA GGCCGACGAC 
CGCGGCCATC TGACGGGCAT CGGCAACATC AATCCGGCGG CGGTGATCAA GCTGTCGGCC 
GATTACGTGA TCTCACACGC GTTCCCGCTT GTGCTGCGCG CGGACGTGCG GCGCAGCGTC 
GGCGGCGCGA ACGGCTGGGT GGCCGATCTC GCCGCCTACA TGCCGCTGCC CGGCAGCTCG 
GAGACGTTCT ACTGGTTCGC GGGGCCGACC GTCACGTTCG CCGATTCGCG CTACATGAAC 
AGCTGGTTCG GCGTGAACGA CGCGCAGGCC GCGCGTTCCG GACATCCGCG TTACGCGTCG 
AGCGCGGGCG TGAAATCGTT CGGCGGCGGC ATGACGCTCG TGTGGTTCGT CACGAAGCAC 
TGGTTCGTGA CGGCCGACGG CGCGATCGAG CAGCTCGTCG GCAGCGCCGC GCGCAGTCCG 
CTCACCCAGC GCTCGACGAA CGCGGTCGTC GACGTGTCGA TCAATTACCA GTTCTAG

Protein sequence

MGDTRHAPRA RLASMAARAL ACARRCRRSS ETGADAPSDA RRPLPAGAAV RLAAPCAGRA 
RLSRENAQYR LQREQRGQHM SDARAVSIRG TAAVRDAAAR RRTARGIVCA ACAAAAVSAH 
AQTPSPLGEW QYSAGVPLDK LFNPNPQTWQ ISVGAAATLQ PRYDGSNQYR PMAGPTFDAR 
YRDLWFVSTG EGIGVNVLRG PNWRATLSAG YDLGRREADD RGHLTGIGNI NPAAVIKLSA 
DYVISHAFPL VLRADVRRSV GGANGWVADL AAYMPLPGSS ETFYWFAGPT VTFADSRYMN 
SWFGVNDAQA ARSGHPRYAS SAGVKSFGGG MTLVWFVTKH WFVTADGAIE QLVGSAARSP 
LTQRSTNAVV DVSINYQF