Gene BURPS668_A3102 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A3102
Symbol
ID	4886150
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	-
Start bp	2941333
End bp	2942889
Gene Length	1557 bp
Protein Length	518 aa
Translation table	11
GC content	72%
IMG OID	640133038
Product	MlrC domain-containing protein
Protein accession	YP_001064093
Protein GI	126443428
COG category	[S] Function unknown
COG ID	[COG5476] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.328821
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGCGCC GTCGCATCAT GAAGATCCTG GTCGCCGGCT TTCGGCACGA GTCGAACACG 
TTCGCACCCA GCAAGGCGAC CTACGCGAGC TTCGCGGCGG ACGGCGGCCG CTATCCGCTG 
TCGCGCGGCG CCGAGATCGG CCGGCTCAAG CGGATGAACC TGCCCGTCGC GGGCGCGCTC 
GCCGCGCTCG CCGACGCCGG CCACGTCGCG CTGCCCGCGG TCTGGGCCGA TGCGACGCCG 
TCGGGCCGCG TCGAATCGGT GGCGTTCGAG CGGATCGCGG GCGAGATCGT CGATGCCGCG 
AAGCGCTACG ACGCCGACGG CGTCTACGTC GATCTGCACG GCGCGATGGC GACCGAGCGC 
TACGACGACG GCGAGGGCGA GCTGCTGCGC CGGCTGCGCG AGACGGTGGG CGCGCGCGTG 
CCGATCGTCG CGTCGCTCGA TCTGCACGCG AACGTCACGC AGCGCATGCT CGACAGCGCG 
GACGGGCTCG TCACGTACCG CACGTATCCG CACGTCGACA TGGCCGATAC CGGGCGCCGC 
GCGGTCGCGC TGCTCGACAC GCTGCTCGGC AGGCGCGGCC GCCACCGCCA TTTCCGCAGC 
GCGCGGCGCG TGCCGTTCCT GATCCCGGTG AACGCGATGT GCACGTCGCT CGAGCCGTCG 
AAGAGCCTGT TCAGGCTGCT CGAGCGGCTC GAGACGGGCG CCGTGCGCTC GCTGTCGTTC 
GCGCCGGGCT TTCCGGCCGC GGACTTCCCG GAATGCGGGC CGACGATCTG GGGCTACGGC 
GCGGACCCCG TCCAGCTCGC GCGCGCGGTC GACGCGCTGT ACGAGCACGT CGTGTCGACC 
GAGGCGCAGT GGTCGGTGCC GTTCATGTCG GCGGACGACG CGGTGACCGA GGCGATCCGG 
ATCGCGCGCG GCGCGGACAA GCCGGTCGTG ATCGCCGACA CGCAGGACAA CCCGGGCGCG 
GGCGGCGGCT CGAACACGAC GGGGCTGTTG CGCGCGCTCG TGCGGCACCG CGCGCCCGAT 
GCGGCGCTCG GGCTGTTCTT CGATCCGGCG GCCGCGTGCG CCGCGCATGC GGCAGGCCGC 
GGCGCGACGG TCGAGATCAC GCTCGGCGCG GACAGCGGGC TGCCGTTTAC CGGGACGTTT 
CGCGTCGAAT CGCTGTCGAA CGGCCGCTGC CATTGCAACG GCCCGATGCT CAAGGGCGCG 
ACGTTCGAGC TCGGCCCGAC CGCGTGCCTG CGGATCGGCG ACGTGCGCGT CGTCGTCACG 
TCGGCGCGCG TGCAGATGAC CGACCGGAGC TTCTATCGGA TCGCGGGCAT CGCGCCCGAG 
ACGATGAAGA TCCTGGTCAA CAAGAGCTCC GTTCATTTTC GGGCGGATTT CGATGCGATC 
GCAGATTGCG TGCTGATCGC GAAAGCGGGC GGCTGGATGG CCGCCGACCC GGCCGATCTG 
CGCTGGACGT CGCTTGCCGA CGGGATACGC ACGAGCCCGT GCGGCTCGCC GTTCTTCGGC 
TGCGGCGGGC GGCGCGCGCC GCATGCGGAC GGGATCGCGG GAGAGATGCG GATATAG

Protein sequence

MERRRIMKIL VAGFRHESNT FAPSKATYAS FAADGGRYPL SRGAEIGRLK RMNLPVAGAL 
AALADAGHVA LPAVWADATP SGRVESVAFE RIAGEIVDAA KRYDADGVYV DLHGAMATER 
YDDGEGELLR RLRETVGARV PIVASLDLHA NVTQRMLDSA DGLVTYRTYP HVDMADTGRR 
AVALLDTLLG RRGRHRHFRS ARRVPFLIPV NAMCTSLEPS KSLFRLLERL ETGAVRSLSF 
APGFPAADFP ECGPTIWGYG ADPVQLARAV DALYEHVVST EAQWSVPFMS ADDAVTEAIR 
IARGADKPVV IADTQDNPGA GGGSNTTGLL RALVRHRAPD AALGLFFDPA AACAAHAAGR 
GATVEITLGA DSGLPFTGTF RVESLSNGRC HCNGPMLKGA TFELGPTACL RIGDVRVVVT 
SARVQMTDRS FYRIAGIAPE TMKILVNKSS VHFRADFDAI ADCVLIAKAG GWMAADPADL 
RWTSLADGIR TSPCGSPFFG CGGRRAPHAD GIAGEMRI