Gene BURPS1106A_1020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_1020
Symbol
ID	4901943
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	996698
End bp	997849
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	64%
IMG OID	640134250
Product	hypothetical protein
Protein accession	YP_001065300
Protein GI	126453481
COG category	[R] General function prediction only
COG ID	[COG0795] Predicted permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTCTCT ACGAAAAATA TTTCGCGCGG CAGATCTACG TCACGTTCAT CTTCGTGCTG 
TTCGCGTTTT CAGGGCTGTT CTTCTTCTTC GACCTGATCA GCGAACTGAA CTCGGTCGGC 
CACGGCAACT ACAAGTTCGG CTACGCGGTG CTGCGCGTCG CGCTGCAGGC ACCGTCGCGC 
TTCTATGAAA TCATCCCGGT CGCCGCGCTG ATCAGCGCGA TCTACGTATT CGCGCAGATG 
GCCGCGAACT CGGAGTTCAC GATCTTCCGC GTGTCCGGCC TCGCGACGAA CCAGGCGCTG 
CGCTCGCTCG TGAAGATCGG CGTGCCGATC GTCATCGCGA CCTACCTGAT CGGCGAATTC 
ATCGGCCCGT ACTCGGATCA GCTGTCCGAG CGCGTGCGGC TCGAGGCGCT CGGCTCGTCG 
GTGTCGACGA ACTTCGCGTC GGGCGTCTGG GTGAAGGACA CGCTCACCGC GCGCGACAAC 
GGCGAGCCCG TCACGCGCTT CGTGAACGTC GGCACGCTGT CGCCCGACTC GACGATCAGC 
GACGTGCGCA TCTACGAGTT CGATTCGAAG TTCAACCTGC AGAACGTGCG GATCGCGAAG 
CGCGGCCACT ACCAGCCGCC CGGCCACTGG CTGCTGACGG ACGTCACCGA TACGCAGCTC 
ACGAGCCTCG CGGGCAACGG CACCGCATCG CCCGTCGATA CGCTCAACCC CGTCTATCGC 
GCGCAGCAGG TCACGCTGCC GCAGTATTCG CTGCGCTCGG ACCTGACGCC GCAGATCCTG 
TCGGTGCTGC TCGTGTCGCC CGAGCGGATG TCGCTCTTCA ATCTGTTTCG CTACATCCAG 
CATCTGAAAG AGAACCAGCA GGACACGCAG CGCTACGACA TCGCGCTGTG GCGCAAGCTG 
CTGTATCCGT TCGCGGTGTT CGTGATGCTC GTGCTGTCGC TGCCGTTCGC GTACCTGCAC 
ACGCGCGCGG GCGTCGTCGG CGTGAAGGTG TTCGGCGGGA TCATGCTCGG CATGAGCTTC 
CAGCTCTTCA ACACGCTGTT CTCGCACATC GGTACGCTGA ACACGTGGCC CGCGCCGCTC 
ACGGCCGCGC TGCCCGGCTG CATCTATCTC GCGCTCGGCC TCTTCGCGCT GAAGTGGGTC 
GATCGGCACT GA

Protein sequence

MRLYEKYFAR QIYVTFIFVL FAFSGLFFFF DLISELNSVG HGNYKFGYAV LRVALQAPSR 
FYEIIPVAAL ISAIYVFAQM AANSEFTIFR VSGLATNQAL RSLVKIGVPI VIATYLIGEF 
IGPYSDQLSE RVRLEALGSS VSTNFASGVW VKDTLTARDN GEPVTRFVNV GTLSPDSTIS 
DVRIYEFDSK FNLQNVRIAK RGHYQPPGHW LLTDVTDTQL TSLAGNGTAS PVDTLNPVYR 
AQQVTLPQYS LRSDLTPQIL SVLLVSPERM SLFNLFRYIQ HLKENQQDTQ RYDIALWRKL 
LYPFAVFVML VLSLPFAYLH TRAGVVGVKV FGGIMLGMSF QLFNTLFSHI GTLNTWPAPL 
TAALPGCIYL ALGLFALKWV DRH