Gene BURPS1106A_A2667 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A2667
Symbol
ID	4904203
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	-
Start bp	2604844
End bp	2606544
Gene Length	1701 bp
Protein Length	566 aa
Translation table	11
GC content	69%
IMG OID	640145770
Product	Na+ dependent nucleoside transporter family protein
Protein accession	YP_001076697
Protein GI	126458076
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG1972] Nucleoside permease
TIGRFAM ID	[TIGR00804] nucleoside transporter

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0472301
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCGGATA GCGCGCGCCC GGCGCGCCCG ACGAGCGCAT CCGCTTTGAA GCGTTCGGGT 
CGTCGGGCAT TCGCCGGCCG CGCATCGCCA TCGCCATCGC CATCGCCATC GCCATCGCCA 
TCGCCATCGC CATCGCCATC GCCATCGCCA TCGCCATCGC CATCGCCATC GCCATCGCCA 
TCGCCCCGGA AAAATTCCCC GTCTCTACCT CGCCAAAATC CCGCCGACAA CCAAAATCGC 
TCGCCGCCCG CGCGAGCGCG CATCTTTCGT TCCCCGATCG ATTCGACCAC TGGCGTTCGC 
CGTCCGCGCA CGTTATGTTC TCGTCCGATG AATAAACGGC GCGCGCGCGC CCGACCGGAG 
ACAGCCGGCG GCCGGCCCGG TTGCGCCGGC GGCGGCGCTT TCCATCCCAT CCTCCGAGGT 
ACGTTCGTGG ACATCTTGCG CAGCTTGTGT GGCATCGTGG TATTGCTCGG CGTCGGTTAT 
GCGCTGTCGG TCAACCGGCG GGCGATCAGC GCCCGCACCG TCGTCGCTGC GCTCGCGACG 
CAGCTCGCGA TCGGCGCGCT CGTGCTGTTC GTGCCCGTCG GCCGCGACGC GCTCGCCGGC 
ACCGCGCATG CGGTCAACAG CGTGCTCGAG ATGGGGCAGC ACGGCGTCGC GTTCCTGTTC 
GGCGGCCTCG TCGGCGACAA GATGTTCGCG CTCTTCGGCG ACGGCGGCTT CGCGTTCGCG 
CTGCGCGTGC TGCCGATGAT CGTGTTCGTC ACGTCGCTGA TCGCGGTGCT CTATTACATC 
GGCGTGATGA AGTGGCTGAT CCGCATCGTC GGCACCGCGA TGGCGAAGCT GCTCGGCGTG 
AGCCGCATCG AGGCGTGCTC GGCCGTGGCG ACGATCTTCC TCGGCCAGAG CGAGATGCCC 
GCGTTCGTGA AGCCGTTCGT GCGGCGGATG AGCGGCACCG AAGTGTTCGC GGTGATGTCG 
AGCGGCATGG CGTCGGTCGC GGGTTCGGTG CTCGCCGGCT ACGCGGGGCT CGGCGTGAAG 
ATGGAGTATC TGCTCGCCGC GTCGTTCATG GCGATCCCGG GCGGCCTGCT GTTCGGCAAG 
ATGCTGTGCC CGACGACGGA GCCCTCGCGC GTCGCCGTCG ACTCGCTCGA GTTCGACGAG 
AAGCGCGCGG CGAACGTGAT CGAGGCGGCC GCCTCCGGCG CGGGCGTCGG GATGCGCATC 
GCGGTGAACG TCGGTACCAT GCTGATCGCG TTCATCGGCC TCATCGCGCT GCTCAACGCG 
ATGGTCGGGC TCGCCGCCGG CTGGCTCGGC TTCGCCGGCG TCACGCTGCA ATCGCTGCTC 
GGCGCGCTGT TCTCGCCGCT CGCGTGGCTG ATCGGCGTGC CGTGGCGGGA TGCGCCGGTG 
GCCGGCAGCT TCATCGGCCA GAAGCTGATC CTGAACGAGT TCGTCGCGTA CGGCGCGCTG 
TCGCCCTATC TGAAGGATGC CGCGCAGGTC GTCGCGGCCG GCTTGCCGGT GCTCGCGCCG 
AAGACGATCG CGATCGTGTC GTTCGCGCTG TGCGGCTTCG CGAATTTCTC GTCGATCGCG 
ATCCTGACGG GCGGCTTCAC CGCGGTCGAG CCCGGCATGC GCTCCGAAGT CGCGCGCTAC 
GGCCTGCGCG CGCTCGCGGC CGCGACGCTG TCGAACCTGA TGAGCGCGAC GATCGCCGGG 
CTGTTCCTGT CCCTTTCCTG A

Protein sequence

MADSARPARP TSASALKRSG RRAFAGRASP SPSPSPSPSP SPSPSPSPSP SPSPSPSPSP 
SPRKNSPSLP RQNPADNQNR SPPARARIFR SPIDSTTGVR RPRTLCSRPM NKRRARARPE 
TAGGRPGCAG GGAFHPILRG TFVDILRSLC GIVVLLGVGY ALSVNRRAIS ARTVVAALAT 
QLAIGALVLF VPVGRDALAG TAHAVNSVLE MGQHGVAFLF GGLVGDKMFA LFGDGGFAFA 
LRVLPMIVFV TSLIAVLYYI GVMKWLIRIV GTAMAKLLGV SRIEACSAVA TIFLGQSEMP 
AFVKPFVRRM SGTEVFAVMS SGMASVAGSV LAGYAGLGVK MEYLLAASFM AIPGGLLFGK 
MLCPTTEPSR VAVDSLEFDE KRAANVIEAA ASGAGVGMRI AVNVGTMLIA FIGLIALLNA 
MVGLAAGWLG FAGVTLQSLL GALFSPLAWL IGVPWRDAPV AGSFIGQKLI LNEFVAYGAL 
SPYLKDAAQV VAAGLPVLAP KTIAIVSFAL CGFANFSSIA ILTGGFTAVE PGMRSEVARY 
GLRALAAATL SNLMSATIAG LFLSLS