Gene Bcep18194_C6667 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bcep18194_C6667
Symbol
ID	3733989
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia sp. 383
Kingdom	Bacteria
Replicon accession	NC_007509
Strand	-
Start bp	181255
End bp	182646
Gene Length	1392 bp
Protein Length	463 aa
Translation table	11
GC content	62%
IMG OID	637760374
Product	Na+/solute symporter
Protein accession	YP_366361
Protein GI	78059786
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG0591] Na+/proline symporter
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.471745
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.266697
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGTCTG TGGTATTCAC GGGTTTCATC CTCCTGTCGT TCTGCCTCGC GCTTTACTCG 
CGCCGAGGCG TAGGCAAGCA GAGCGTGCAC GATTTCTTCG TCGCATCGCG GCAGTTCGGT 
GCATTTCTCG TCTTCTTCCT GGCAGCGGGC GAGATTTACA GCGTCGCGAC GATGGTCGGC 
TTCGCGGGCG GCATCTATGC GAAGGGGCCG ACCTACGGGA TCTGGTTCCT CGGCTACATT 
CTGCTCGCCT ACCCGCTCGG CTATTTTCTC GGCCCGAAGA TCTGGGAAGC AGGGCAGCGC 
TACAACGCGA TTACGCTTGC GGACCTGTTC GGCGGCTATT TCCGAAGCCG CTCGACCGAG 
TTCGTCGTCG CGCTGTCGTC GATCGTGTTT CTGCTGCCGA TGGCTCAACT GCAGTTCACG 
GGCCTCGTTG CCGCGTTTCG TGGCCTGGGC TGGCAATTCG AGCCGCTGCA CATGGTGCTG 
ATCGCTGGTG TGCTCGCGTT TCTATACATC ATGATCGCCG GTATCCGTTC GTCGGCGTAC 
GTCGCCGTGT TGAAGGACAT CCTGATGGTC CTGGCGATCG TGATCACGGG CCTGGCCGTG 
GCGGGACACG TCGGCGTGAC GGAGGTGTTC CACGCAGCGA GCCTGCACGT GGGCAACCAG 
ATGAATGCGG AACAGCTGCG GTTCTCGATG AGCACGATCC TGCTGCAATC GCTCGGCTTC 
CTTGCGATGC CGTTCGGTGT GCAGATTTTC TTCACCGCGA AAAGCGCCGA CACGATCCGA 
CGCTCGCAGA TCGCGATGCC GCTCTATATG CTGATGTATC CGTTCCTCGT CATCGCCGCG 
TACTACGCAA TCAGCCAGAA CCTGCATCTC CGCTCGCCGA ACGAAGCGTT CTTCGCTGCC 
GCGAATGCGT TGCTCCCGTC GTGGATGCTC GGGCTCGTCG CAGCGGCGGC AGCGCTCTCC 
GGCCTGCTCG TGCTGACCAG CATGTGTCTC GCGATCGGCC CGATCGTGAG CCGCAACCTG 
CTGCCGTCGC TGCCGTCGCA ACGGCAAACA GGGGCGGCGA AGATCGTCAT TTTCGTGTAC 
CTCGGTGTGT CCATTGCGAT GACGTCTGCA GCACCCACGC TGATGCTTAC GCTGATCAAC 
GTCACCTATT ACGGCGTCAC CCAGTTCTTC CCGGGCCTGA TCGCCGTGCT GTTCTCGCTG 
CGTATCCGGC CGGTGGCGGT GACGGCAGGC ATGCTCGTTG GACAAGGTCT CGCGTTGGCG 
CTGTATCTCG GGAAGGTTCA GCTCGGCGGC ATCAACCTGG GTTTGCCGTG CCTGGCCGCC 
AACATCGCTA CGGTCGCGGC GATCCATTAC CTGCTGGGCG CGGCCAAGCC CCGGACGTTG 
GCCTCGCAAT GA

Protein sequence

MSSVVFTGFI LLSFCLALYS RRGVGKQSVH DFFVASRQFG AFLVFFLAAG EIYSVATMVG 
FAGGIYAKGP TYGIWFLGYI LLAYPLGYFL GPKIWEAGQR YNAITLADLF GGYFRSRSTE 
FVVALSSIVF LLPMAQLQFT GLVAAFRGLG WQFEPLHMVL IAGVLAFLYI MIAGIRSSAY 
VAVLKDILMV LAIVITGLAV AGHVGVTEVF HAASLHVGNQ MNAEQLRFSM STILLQSLGF 
LAMPFGVQIF FTAKSADTIR RSQIAMPLYM LMYPFLVIAA YYAISQNLHL RSPNEAFFAA 
ANALLPSWML GLVAAAAALS GLLVLTSMCL AIGPIVSRNL LPSLPSQRQT GAAKIVIFVY 
LGVSIAMTSA APTLMLTLIN VTYYGVTQFF PGLIAVLFSL RIRPVAVTAG MLVGQGLALA 
LYLGKVQLGG INLGLPCLAA NIATVAAIHY LLGAAKPRTL ASQ