Gene BURPS668_0330 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_0330
Symbol
ID	4884911
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	+
Start bp	310520
End bp	311710
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	72%
IMG OID	640126258
Product	hypothetical protein
Protein accession	YP_001057383
Protein GI	126441994
COG category	[S] Function unknown
COG ID	[COG1565] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATCCGA AAGCTCACGA ACCCGCTAGT TTACCCGTTC CCGGCCCCGA CGCGCTCGCG 
CAGTCCGACG CGCTCGCCGC GTCGCTGCGC GCCGAAATCG CCGCGGCGGG CGGATGGATC 
CCGTTTTCCC GCTACATGGA GCGCGTGCTG TACGCGCCGG GCCTGGGTTA CTACAGCGGC 
GGCGCGCAGA AATTCGGCCG GCGCGGCGAC GACGGCAGCG ATTTCGTGAC CGCGCCCGAG 
CTGTCGCCGC TCTTCGCGCA GACGCTCGCG CGCCCCGTCG CGCAGGCGCT CGCCGCGAGC 
GGCACGCGGC GGGTGATGGA ATTCGGCGCG GGCACGGGCC AGCTCGCGGC GGGGCTGCTG 
AACGCGCTCG CCGCGCTCGG CGTCGAGCTC GACGAATATG CGATCGTCGA TTTGTCCGGC 
GAGCTGCGCG CGCGCCAGCG CGAGACGCTC GACGAACAGG CGTCCGGCGC CGCCGCGCGC 
GTGCGCTGGC TCGACGCGCT GCCCGAGCGC TTCGAGGGCG TGATCGTTGG CAACGAAGTG 
CTCGACGCGA TGCCGGTGCA ACTCGTCGCG AAGCATGCGC ACGGCTGGTG CGAGCGCGGC 
GTGTCGCTCG GCGATGCGGG CGCGTTCGCG TTCGCCGACC GGCCGCTCGC GCGCGCCGAG 
GACGCGGCGC GGCTCGCGGC GCTCGACGCC GACGAAGGTT ACGTGACCGA GACGCACGAC 
GCGGCGGCGG CGTTCGTCGG CACGGTCTGC GCGATGCTCG CGCGCGGCGC GGCGTTGTTC 
ATCGACTACG GCTTTCCGCG CCACGAGTAC TATCACCGGC AGCGCGCGCA GGGCACGCTG 
ATGTGCCATT ACCGGCACCG CGCGCACGGC GATCCGTTCG TCTATCCGGG GCTGCAGGAC 
ATCACCGCGC ACGTCGAATT CAGCGCCGTC TACGAGGCGG GCGTCGGCGC GGGCGCTGAG 
CTGCTCGGCT ACACGTCGCA GGCGCGCTTT CTGCTGAACG CGGGCATCAC CGACGTGCTC 
GCCGAGATCG ACCCGTCCGA CGCGCAACGC TTCCTGCCCG CCGCGAACGC GGTGCAGAAG 
CTGATTTCCG AGGCGGAGAT GGGCGAGCTC TTCAAGGTGA TCGCGTTCTC GCGCGGCATC 
GACGGCATGC TCGACGCGTT CGCGCGCGGC GATCGTTCGC ACACGCTGTA G

Protein sequence

MNPKAHEPAS LPVPGPDALA QSDALAASLR AEIAAAGGWI PFSRYMERVL YAPGLGYYSG 
GAQKFGRRGD DGSDFVTAPE LSPLFAQTLA RPVAQALAAS GTRRVMEFGA GTGQLAAGLL 
NALAALGVEL DEYAIVDLSG ELRARQRETL DEQASGAAAR VRWLDALPER FEGVIVGNEV 
LDAMPVQLVA KHAHGWCERG VSLGDAGAFA FADRPLARAE DAARLAALDA DEGYVTETHD 
AAAAFVGTVC AMLARGAALF IDYGFPRHEY YHRQRAQGTL MCHYRHRAHG DPFVYPGLQD 
ITAHVEFSAV YEAGVGAGAE LLGYTSQARF LLNAGITDVL AEIDPSDAQR FLPAANAVQK 
LISEAEMGEL FKVIAFSRGI DGMLDAFARG DRSHTL