Gene BURPS668_0248 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_0248
Symbol
ID	4883911
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	+
Start bp	238075
End bp	239223
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	73%
IMG OID	640126176
Product	GumN family protein
Protein accession	YP_001057301
Protein GI	126440169
COG category	[S] Function unknown
COG ID	[COG3735] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.49134
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTGAGG CAGTGGCGGC GCGCGAAGCC GCGCGCCGCT CGCGTAACGG CGTGCGGCGC 
GCGGCGACGC ACGCCGCACG CGCGCCCCGG CGCTGGCGCG CGCGCTCGCT CGCGAGCGCC 
GTGCTCGCCG GCGCGTGCGC GACGGGCGGG CTCGCATGGC CGCCCGCCGG CGCGCTGGCG 
GCGGGCAGCG TCGCGGCCGC GCCGCTGCCG CAGGCGCCGA TTCCCGCGCC CGGCATGTCG 
CTGCCGGGCT TTCACGCGCC GCCGCCGTCG ACGTCGAACG GCACGGTCGC GAGCGGCGCG 
GTACGCACGC AGCCCGCGCG AATGCCGTTC TACGTCGCGA CGAAGGGCAA AGTCACGATC 
TACGTGCTCG GCACGCTGCA TGTCGGCGAC CCCGCCGACT ATCCGGCGAA CCAGCCGTTT 
CGCCGGCCGA TCCTCGCGGC GCTCGCCGCG TCGCCGACGC TCGCGCTCGA ACTGTCGCCG 
GACGACCTGC TCGAATCGCA GGACGACGTA TCGAAGTACG GCGTGTGCAA CTACGCGTGC 
CTGCCGCGGC TGTTGCCGCC GCCTCTCTGG CAAAAGCTCG CGAACCGCCT GCGCGGCAAT 
CCGGCCGCGC TCGCCGGCAT CCGCAACATG CGGCCCTGGC TCGCGTCGCT CGTCGTCGAG 
ACGTACGATT CGCTGTCGGC CGGCTTGCAG ACCGAATACG GCACCGAGGC GCAACTGCAG 
AACGTGTTCC TGCGCAAGAA GGGCGGCAAG GTGGTCGGGC TCGAGACGCT CGCCGAGCAG 
ATGCGCGCGT TCACGGGGCT CACGCTCGCG CAGCAGCGGG AGATGCTCGC GCAGGACATG 
GTGCAGACGC CCGCGCAGAA CGCGGCCGAC GTGCGCGCGC TGCATCGCCT CTGGCGCATC 
GGCGACGCGG ACGCGATCGC CGCCTGGGCG AACGCGAAGA CGGAGCGGCT CGCACGCGCG 
CGGTCGATCG CCGATTCGAT CGACAACAAG ATCGTCTATG AGCGCAACCG CCGCTTCGTC 
GCGCGGATGA CGGCGATCGC CGCGCCGAAC CGGCCGCTGT TCGTCGCGAT CGGCTCGTTG 
CACCTGGGCG GCCCGAAGGG CGTGCTCGAA CTGCTTCGGC AGCAGGGCTA TCGCGTCGAC 
GCCGGGTGA

Protein sequence

MPEAVAAREA ARRSRNGVRR AATHAARAPR RWRARSLASA VLAGACATGG LAWPPAGALA 
AGSVAAAPLP QAPIPAPGMS LPGFHAPPPS TSNGTVASGA VRTQPARMPF YVATKGKVTI 
YVLGTLHVGD PADYPANQPF RRPILAALAA SPTLALELSP DDLLESQDDV SKYGVCNYAC 
LPRLLPPPLW QKLANRLRGN PAALAGIRNM RPWLASLVVE TYDSLSAGLQ TEYGTEAQLQ 
NVFLRKKGGK VVGLETLAEQ MRAFTGLTLA QQREMLAQDM VQTPAQNAAD VRALHRLWRI 
GDADAIAAWA NAKTERLARA RSIADSIDNK IVYERNRRFV ARMTAIAAPN RPLFVAIGSL 
HLGGPKGVLE LLRQQGYRVD AG