Gene Bcep18194_C7694 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bcep18194_C7694
Symbol
ID	3734581
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia sp. 383
Kingdom	Bacteria
Replicon accession	NC_007509
Strand	-
Start bp	1340897
End bp	1341847
Gene Length	951 bp
Protein Length	316 aa
Translation table	11
GC content	62%
IMG OID	637761395
Product	ABC proline/glycine betaine transporter, periplasmic ligand binding protein
Protein accession	YP_367382
Protein GI	78060807
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2113] ABC-type proline/glycine betaine transport systems, periplasmic components
TIGRFAM ID	[TIGR03414] choline ABC transporter, periplasmic binding protein

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.51441
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATCGAA CTGGTATGGC GGCGCTGGTC GCCGCGCTGT GCATGTCCGC GGCAGTCCAT 
TCCGCGGGCG CGGCGGAGCC GGCGGCCTGC AGAAACGTGC GTATGGCCGA TGTCGGCTGG 
AGCGACATCG CGGCCACGAC CGGGCTGGCT TCCACGATGC TGTCCGCGCT GGGCTACAAC 
CCGTCGAAGA CGATCGCATC GGTGCCGATT ACGTTTGCCG GGGTCAAGAG CAAGCAGATC 
GACATTTTCC TCGGCTACTG GTCGCCCTCG ATGGATCCGA TCATCGCGCC GTTCGTCAAG 
AGCGGCTCGA TCAAGGTCCT TCCCGAGCCG AACCTGAAAG GCGCGAAATT CACGCTGGCG 
GTGCCGGACT ACGTGTATCA GGCGGGGCTC AGGACGTTCG CGGACCTGCC GAAGTATGCG 
GACAAGCTGC AGTACCGCAT TTACGGGATC GAGCCGGGGA ACGACGGCAA CCAGCTGATC 
GGCAAGATGA TCCGGGAGAA CAAGGACGGG ATCGGCAAGT TCAAGCTGGT GGAATCGAGC 
GAGGCAGGCA TGCTCGTCGA GCTCAACCGG GCCGTTCGCG ACAAGCAGTG GATCGTGTTT 
CTTGCGTGGG AGCCTCATCC GATGAATGCG CAACACAGGA TCAACTACCT GTCCGGTGGC 
GATGACGTGT TCGGCCCGAA CTACGGCGAG GCGAAGGTGT TCACGGTCGA GCCGCCGGAT 
TACGAGGCGC GGTGCCCGAA TGTTGCGAAG TTCGCGTCGA ACCTGCATTT CACGACCGAG 
CTCGAGAATC ATTTGATGAT TCCGATCATG AACCACCAGG ATCCGAACCA GGCCGCGACG 
GAATGGCTGA AACGGAACAC GTCGATGCTG GACACGTGGC TGGCCGGCGT CACGACGTTC 
GACGGCAAGC CGGCGCTACC GGCGGTGAAA GCGTATCTTG CTGCGCACTA G

Protein sequence

MNRTGMAALV AALCMSAAVH SAGAAEPAAC RNVRMADVGW SDIAATTGLA STMLSALGYN 
PSKTIASVPI TFAGVKSKQI DIFLGYWSPS MDPIIAPFVK SGSIKVLPEP NLKGAKFTLA 
VPDYVYQAGL RTFADLPKYA DKLQYRIYGI EPGNDGNQLI GKMIRENKDG IGKFKLVESS 
EAGMLVELNR AVRDKQWIVF LAWEPHPMNA QHRINYLSGG DDVFGPNYGE AKVFTVEPPD 
YEARCPNVAK FASNLHFTTE LENHLMIPIM NHQDPNQAAT EWLKRNTSML DTWLAGVTTF 
DGKPALPAVK AYLAAH