Gene BURPS668_1099 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_1099
Symbol
ID	4882779
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	+
Start bp	1076123
End bp	1077463
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	69%
IMG OID	640127027
Product	ABC transporter, ATP-binding protein
Protein accession	YP_001058149
Protein GI	126441069
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1116] ABC-type nitrate/sulfonate/bicarbonate transport system, ATPase component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAAACC CGAATGCTGT CAACGCCCCC GTCCAGACGC CGCCCGCGCC GCCGCGGGTC 
GGCGAGGAAA TCCTGCGCGT CGAGAACGTG AGCCGCGGCT TCAACAAGAC GCAGGGCGAG 
CTGCTCGTGC TCGACGGCGC GAACCTGTCA CTGCGCGAAG GCGAGATCGT CGGGCTGCTC 
GGCCGCTCGG GCTCCGGCAA GTCGACGCTC CTGCGGATCA TCGCCGGGCT GATCGAGCCG 
ACGGGCGGCG AGGTCACGTA TCTCGGCAAG CCGCTGTCCG GCCCGGCCGA AGGCGTCGCG 
ATGGTGTTCC AGACCTTCGC GCTGTTTCCG TGGCTCACCG TGCTGCAGAA CGTCGAGGCG 
GGGCTCGAGG CGCTCGGCGT CGGTGCGCGC GAGCGGCGCG AGCGCGCGCT CGCCGCGATC 
GACCTGATCG GCCTCGACGG CTTCGAGAAC GCGTACCCGC GCGAGCTGTC GGGCGGCATG 
CGCCAGCGCG TGGGCTTCGC GCGCGCGCTC GTCGTCGATC CGACGCTGCT CCTGATGGAC 
GAGCCGTTCT CCGCGCTCGA CGTGCTGACG GCCGAGACGC TGCGCACCGA TCTGCTCGAT 
CTGTGGACGC AGGGCCGGAT GCCGATCAAG TCGGTGCTGA TCGTCACGCA CAACATCGAG 
GAAGCGGTGT TCATGTGCGA CCGGATTCTC GTGCTGTCGT CGAATCCGGG CCGCGTGATC 
GCGGAGATCA AGGTGCCGTT CAAGCATCCG CGCAACCGGC TCGACCCGGC GTTCCGGCGC 
CTCGTCGACG ACATCTACGC GAAGATGACC GCGCGCCAGG TCGGCGAGGC GACGAAGAAG 
GGGCTCGAGC TCGGCAGCTG GCTGCCGCAG GTGTCGACGA ACCTGATGGC GGGTCTCATC 
GAGACGCTCG CCGCGCCGCC GTACCACGGC CGCGCGGACA TGCCCGAGAT CGCCCGCACG 
CTGCACCTCG AGGTCGACGA TCTGTTCCCG ATCGCCGAAG TGCTGCAGTA CCTGGGCTTC 
GCCGACGTGC GCGAGGGCGA CGTGTTCCTG ACGCCGCCGG GGCGCGTGTT CGCCGAATTC 
GGCACGCAGG AGCGCAAGAT GATGTTCGCC GAGCATCTGC TGCGCCACGT GCCGCTCGCC 
GCGCGGATCA AGAAAGTGCT GAACGAGCGG CCCGGGCATC GCGCGCCGCG CGTGCGCTTC 
GAGCAGGAGC TCGAGGATTT CCTGTCGGAC GGCGCGGCTG AGGAGACGCT CGACGCGGTG 
ATCGACTGGG GCCGTTACGG CGAGATCTTC TCGTACAACG ACCAGACCGA GATCTTCAGT 
CTCGAGGACG TCGAGTCCTG A

Protein sequence

MQNPNAVNAP VQTPPAPPRV GEEILRVENV SRGFNKTQGE LLVLDGANLS LREGEIVGLL 
GRSGSGKSTL LRIIAGLIEP TGGEVTYLGK PLSGPAEGVA MVFQTFALFP WLTVLQNVEA 
GLEALGVGAR ERRERALAAI DLIGLDGFEN AYPRELSGGM RQRVGFARAL VVDPTLLLMD 
EPFSALDVLT AETLRTDLLD LWTQGRMPIK SVLIVTHNIE EAVFMCDRIL VLSSNPGRVI 
AEIKVPFKHP RNRLDPAFRR LVDDIYAKMT ARQVGEATKK GLELGSWLPQ VSTNLMAGLI 
ETLAAPPYHG RADMPEIART LHLEVDDLFP IAEVLQYLGF ADVREGDVFL TPPGRVFAEF 
GTQERKMMFA EHLLRHVPLA ARIKKVLNER PGHRAPRVRF EQELEDFLSD GAAEETLDAV 
IDWGRYGEIF SYNDQTEIFS LEDVES