Gene BURPS668_A1833 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A1833
Symbol
ID	4888914
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	+
Start bp	1790384
End bp	1791679
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	76%
IMG OID	640131770
Product	amino acid transporters
Protein accession	YP_001062827
Protein GI	126444425
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0531] Amino acid transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.273925
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATGCCC CCGCCGAGCC CGGCGCCACG GCCGTGCCGC ACCGTGCCGG CTCGCTCACG 
ATCCTCCAGG GCGCCGCGCT CTATATCGGC GCGGTGCTCG GCACCGGCGT CATCGCATTG 
CCCGCGCTCG CGGCGGAGGT CGCCGGCCCC GCGTCGCTGC TCGCGTGGGC GGCGCTCGTC 
ATGCTGTCGA TTCCGCTCGC CGCCACCTTC GCCGCGCTCG GCGCCCGCTA TCCGGACGCG 
GGCGGCGTCT CCACCTATGT GCGCAAAGCG TTCGGCCCGA AAGCGGCGGC CGTCGTCGGC 
TGGTGCTTCT ATTTCGCGGT GCCGGCCGGC GCCCCCGCCG CCGCGATGTT CGGCGGCGCC 
TACGTCGCCG CCGTCACGGG CGGCGCACAC GCGACGATGA TCGCATCGGC GGCCGTGCTG 
ATCGCGCTCG TCGCGGCCGC GAACGCGTTC GGCGTCACCG TGTCGGGCCG CATGCAGCTC 
GTGCTGTCCG CGCTGCTCGT CGCGCTGCTC GTGGCCGCCG TGCTCGCCTC CGCCCCGCAC 
GCGCGCGCCG CGAACCTGCA TCCGTTCGCG CCGCACGGCT GGCTCGCGGT CGGCGAGGCC 
GCCGCGCTGC TCGTCTGGAG CTTCGCCGGC TGGGAGGCGA TCACGCATCT CGCCGCCGAA 
TTCCGGCGCC CCGCGCGCGA TCTGCCGCGC TCGACGGGCA TCGCGGTCGC GGTGGTCGGG 
CTGCTGTACC TGTCGGTCGC GGCCGCGAGC GTGCTCGTGC TCGGCCCCGC CGCGGGCGAA 
TCCGGCGCGC CGCTCGCGGC GCTGATCGCG CGCGGGATCG GCGGCAACGC GCAACTGATC 
GCGACGGCGG CCGCGCTGCT GCTCACGCTC GGCACGATGA ACGCCTATTT CGCGGGCGCG 
GCGAAGCTCG GCGCCGCGCT CGGCCGCGAC GGCGCGCTGC CCCGCTGGTT CGCGCAGGGC 
AGCCAGACGG GCGGCGTGCC GCGGCGCAGC CTCGCCGTCG TCGCCGCGCT CGCCGGCTGC 
GCGCTCGTCG CGGCCGTCGC GACGGGCATG GGACCGAAGC CGCTCGTGCT CGCGACATCG 
GGCAATTTCG TGATGGTCTA CGTGCTCGGC GCGGCGGCGG CCACGAGGCT CCTGCCGCGC 
GGCGGGCTCG CGCATCGCGC ATCGATCGTC GCGCTGCTGT CGGCGCTCCT GCTGCTCGCG 
ACGACGGGCT GGTATCTGCT GTGGCCGCTG CTGCTGACCG CGTCGGCAAT CGGCTATCTT 
TTCATCACGG GCAGGCGGGC GGCGGCGAAG CGGTGA

Protein sequence

MNAPAEPGAT AVPHRAGSLT ILQGAALYIG AVLGTGVIAL PALAAEVAGP ASLLAWAALV 
MLSIPLAATF AALGARYPDA GGVSTYVRKA FGPKAAAVVG WCFYFAVPAG APAAAMFGGA 
YVAAVTGGAH ATMIASAAVL IALVAAANAF GVTVSGRMQL VLSALLVALL VAAVLASAPH 
ARAANLHPFA PHGWLAVGEA AALLVWSFAG WEAITHLAAE FRRPARDLPR STGIAVAVVG 
LLYLSVAAAS VLVLGPAAGE SGAPLAALIA RGIGGNAQLI ATAAALLLTL GTMNAYFAGA 
AKLGAALGRD GALPRWFAQG SQTGGVPRRS LAVVAALAGC ALVAAVATGM GPKPLVLATS 
GNFVMVYVLG AAAATRLLPR GGLAHRASIV ALLSALLLLA TTGWYLLWPL LLTASAIGYL 
FITGRRAAAK R