Gene BURPS668_A1440 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A1440
Symbol
ID	4885953
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	+
Start bp	1346456
End bp	1347571
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	66%
IMG OID	640131379
Product	His/Glu/Gln/Arg/opine ABC transporter permease
Protein accession	YP_001062437
Protein GI	126442978
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4215] ABC-type arginine transport system, permease component
TIGRFAM ID	[TIGR01726] amine acid ABC transporter, permease protein, 3-TM region, His/Glu/Gln/Arg/opine family

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCGCCGTC GATCCGTGCG GCGCGGCGAT TCGATCCCGC GCGTGCGTGC CCGTGTTCCG 
CCGGATGCGG AAGTTCGCCG TCACGCGCGC TCGCCGCGCG CCGCCGGCGG TTTCCCGCCC 
GTTTCAGCGG CGCGGCCCCG TATGCGCGCG GCGCGTCGCC CATCGCGGCC GAATCCTTTC 
GATGTCCGGA CAATCGAGCG CCGCGGCCCG CGGGTCGTGC TTGAGCATGA TGCGGTCGAT 
CGAACATTAG AAAAAACACT GATTGCCGGG CAAAATCGGC CGCCGCAAAG TTGTACATAC 
AACTTCGGCG CGATCGAAAT CGCCGCGTCG AACCGGTTCG CAAGCTTTCA CCCACCCGAC 
GGACAGGTTG CCCGCCCGCT TCATGGCGGC GGCGCGCCGC GTCCGCGCAC CTCGAGGAAA 
TCGCAGATGC TCTTTCAAGG CTTCGGCCCG CTGCTCTGGG CCGGCACGAT CGAGACGGTC 
AAGCTCGCCG TGCTTTCGCT CGCCGCGTCG CTCGTGCTCG GGCTTGCCGG CGCGGCCGCC 
AAGCTGTCGT CCAATCGCGC GTTGGCGAGC GTCGGCACGT TCTACACGAC GCTGATTCGT 
GCGGTGCCGG ATCTCGTGCT GATGCTGCTG CTGTTCTACG GCATCCAGAT CCTGCTGAAC 
GACGTGACCG ACATGCTCGG CGCCGAGCAG ATCGACATCG ATCCGTTCGT CGCCGGCATC 
GTCACGCTGG GCTTCATCTA CGGCGCCTAC TTCACCGAGA CGTTTCGCGG CGCGTTCCTC 
GCGGTGCCGC GCGGCCAGCT CGAAGCGGGC TTCGCGTACG GCATGGGTGC GTGGCGTGTG 
TTCGCGCGGA TCATGTTTGC GCAGATGATG CGCTTCGCGC TGCCCGGCAT CGGCAACAAC 
TGGCAGGTGC TCGTGAAGGC GACCGCGCTC GTGTCGATCA TCGGGCTGGC CGACGTCGTG 
AAGGCCGCGC AGGACGCCGG CAAGAGCACG CTGAATTTCT TCTTCTTCAC GCTCGCGGCG 
GGCGCGATCT ACCTCGCGAT CACGACGCTG TCGAACCTCG TGTTGATGTA CCTCGAAAAA 
CGCTATTCGG CGGGTGTGCG GAGGGTGGCG CTGTGA

Protein sequence

MRRRSVRRGD SIPRVRARVP PDAEVRRHAR SPRAAGGFPP VSAARPRMRA ARRPSRPNPF 
DVRTIERRGP RVVLEHDAVD RTLEKTLIAG QNRPPQSCTY NFGAIEIAAS NRFASFHPPD 
GQVARPLHGG GAPRPRTSRK SQMLFQGFGP LLWAGTIETV KLAVLSLAAS LVLGLAGAAA 
KLSSNRALAS VGTFYTTLIR AVPDLVLMLL LFYGIQILLN DVTDMLGAEQ IDIDPFVAGI 
VTLGFIYGAY FTETFRGAFL AVPRGQLEAG FAYGMGAWRV FARIMFAQMM RFALPGIGNN 
WQVLVKATAL VSIIGLADVV KAAQDAGKST LNFFFFTLAA GAIYLAITTL SNLVLMYLEK 
RYSAGVRRVA L