Gene BURPS1106A_2390 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_2390
Symbol
ID	4901013
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	2356708
End bp	2357964
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	71%
IMG OID	640135618
Product	twin-arginine translocation pathway signal sequence domain-containing protein
Protein accession	YP_001066650
Protein GI	126453350
COG category	[S] Function unknown
COG ID	[COG4102] Uncharacterized protein conserved in bacteria
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACGAC GTGATTTTCT GGCCCTGGCG AGCCTTGCCG GCGCGGCGGG CGTATCGTTG 
CCGGTGCCGT ATGCGTTCGC TGCCGCGCCG GGCGAGACGA GCGCAACGGG GGCGATGGGA 
GCGGTGGGGG CGGCGGCGCG CGCCGCACGC TACTCGAACC TGCTGATTCT CGTCGAGCTC 
AAGGGCGGCA ACGACGGGCT CAACACGGTG ATTCCGTACG CGAATCCGCT GTACCGCACG 
CTGCGCCCGG CGATCGGCGT CAAGCGCGAG CAGGTCGTGC AGCTCGACGA GCGCGCCGCG 
CTGCATCCGG CGCTCGAGCC GCTCATGCCG ATCTGGCGCG ACGGACGGCT CGCGATCGTC 
GAAGGCGTCG GCTATCCGCA GCCGAATCTG TCGCACTTTC GCTCGATCGA GATCTGGGAT 
ACCGCGTCGC GCGCGAACGA GTATCTGCGC GAAGGGTGGC TCACGCGCGC GTTCGCGCAG 
GCGAGCGTGC CGCCCGGCTT CGCCGCGGAC GGCATCGTGC TCGGCAGCGC GGAAATGGGG 
CCGCTCGCGA ACGGCGCGCG TGCGATCGCC CTCGTGAATC CCGCGCAGTT CGCGCGCGCG 
GCGCGACTCG CGCAGCCCGT GTCGCTGCGT GAGCGCAACC CCGCGCTCGC GCACGTGATC 
GATATCGAAA ACGACATCGT CAAGGCCGCC GATCGGCTGC GTCCGCATGC GGGCACGCCC 
GCGCTCGCGA CCGCGTTTCC GGGCGGGCCG TTCGGCGCAT CGGTGAAGAC CGCGATGCAG 
GTGCTCGCCG CGTGCGATAC GCCGCAGCGT ACGCCGGCGC CGGGGCAGGG CGTCGCGGTG 
CTGCGCCTCA CGCTGAACGG CTTCGACACG CATCAGAACC AGCCCGGCCA GCAGGCGGGC 
TTGCTCGGCC AACTGGCGCA AGGGCTGGTG GCGATGCGCT CGGCGTTGAT CGAGCTCGGG 
CGCTGGAACG ATACGCTCGT GATGACGTAT GCGGAGTTCG GCCGGCGCGC GCGAGAGAAT 
CGGAGCAACG GAACCGATCA CGGCACGGCC GCGCCGCATT TCGTGATGGG CGGGCGCGTG 
CGGGGCGGGC TGTACGGCGC GCCGCCCGCG CTCGACGCGC TCGACGGCAA CGGCAACCTG 
CCTGTCGCCG TCGATTTCCG TCAGCTTTAT GCGACCGTGC TCGGCCCATG GTGGGGGCTC 
GACGCGGCGA GTGTGCTCAG GCAGCGTTTC GAGCCGCTGC CGTTGCTGCG CGCCTGA

Protein sequence

MKRRDFLALA SLAGAAGVSL PVPYAFAAAP GETSATGAMG AVGAAARAAR YSNLLILVEL 
KGGNDGLNTV IPYANPLYRT LRPAIGVKRE QVVQLDERAA LHPALEPLMP IWRDGRLAIV 
EGVGYPQPNL SHFRSIEIWD TASRANEYLR EGWLTRAFAQ ASVPPGFAAD GIVLGSAEMG 
PLANGARAIA LVNPAQFARA ARLAQPVSLR ERNPALAHVI DIENDIVKAA DRLRPHAGTP 
ALATAFPGGP FGASVKTAMQ VLAACDTPQR TPAPGQGVAV LRLTLNGFDT HQNQPGQQAG 
LLGQLAQGLV AMRSALIELG RWNDTLVMTY AEFGRRAREN RSNGTDHGTA APHFVMGGRV 
RGGLYGAPPA LDALDGNGNL PVAVDFRQLY ATVLGPWWGL DAASVLRQRF EPLPLLRA