Gene Bcep18194_A3857 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bcep18194_A3857
Symbol
ID	3749041
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia sp. 383
Kingdom	Bacteria
Replicon accession	NC_007510
Strand	-
Start bp	765430
End bp	767280
Gene Length	1851 bp
Protein Length	616 aa
Translation table	11
GC content	58%
IMG OID	637762135
Product	capsule polysaccharide biosynthesis
Protein accession	YP_368100
Protein GI	78065331
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3563] Capsule polysaccharide export protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.211188
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCACGTT CACCGACGAT CCATACGCAC TCTTGGCCGA ATGGCATCAT GCCACGCAAA 
AAAGGGCCGG CGCTCTCGTG GTTCACCACT TCCCTCGAAT CTGAAACGGC CGATGGATGG 
ATCGGCCGCA TCGATGCCGA ACTCGCGACC TTATCCGCAA TCGGCTCGGC ATTGAATATC 
ACGCGGCTCG TGGAGCGATT CCGTGCCGCC AACGTATTCG ATCCATCGAG CTGCGCCACG 
CGTATTCCGC TCGGCTTGCT CGAGCGCGGC ACCGCACAGC GAGTGCTGGT GCTCGACGAG 
CCCGCATCCG TCTATTTGCA GGCACCGCGC AGAGAAAGGG AAAGGCAGTT TTCCCGAATG 
CTGGCCGCAG TGCACCGCGA GCAACCAGAG GCAGAAATTT GGTTCGCCCG TAGTGGCATA 
TCGAGTTCAG GAGAATGGCT TTCGTCGTCC CATCCAGGAA TCCGCGGTTC GAATCGATAC 
ATCGACACAA GCGAGTCACT CTGCGCTTCC CTCCCGTATT TCGACCACGT CTATACGCTC 
TCCGCAGTTG AAGGGATGCA AGCGTTGCTT TGTGGCGTCC CGGTACATGT ATTCGGTATG 
CCGTACTACG CTGGCTGGGG ATTGACGCAC GACGATGCGC CCCAGCCGGC AAGGCAATCG 
CACGCGACTC TGGAATCATT GTTCGAAGTT GTGTTCATAC GCCTTTCCCG TCATCTCGCC 
CCTGCAGGAA AGACATCCGA TTCGCTCGAA GCACTCCTTG ACGCAATCGA AGCTCATCGC 
GCAACCGTAT TACGCTTCGC CGATATACGC CACGTAGCAG GCATCCGTTT CCAGTGGTGG 
AAACGACCCT TCGCTACTCC TTTCCTGACG GCCGGTGGCG GAACACTGCG CTGGACGGAT 
GACGCAAGCA AGCTTGCGGA AGGAGAGCAT GCCGCATTTT GGGGTGCGCG TAGTACAGAG 
GGCTTGCCAC CCGACACACC GGCCGTCCGT ATCGAGGACG GCTTCCTGCA CTCGATCGGC 
CTCGGCTCAG ACCACGTCGC TCCATGCAGC CAGATAATCG ACCGGCGCGG CCTCTATTTC 
GACCCGAGCC GCCCGAGCGA CCTGACGGTG ATCCTGAACG AAACGGATTT CAATGAAACT 
GAACTCGCGC GGGCTGACGC ATTGCGCAAC GAGATCACCC GCCTAGGGTT GACAAAGTAC 
AATCTCGGTC GCCGCAAGCC GGCTTGGCAC GCGCCGCCGG GCAAGCGCGT TGTGCTCGTG 
CCGGGACAGG TCGCAGACGA CGCGTCGATT CGACTCGGTA CGCGCGGCAT CACGACAACC 
GAAGAATTGC TGCGAACGGT ACGCGCCCAC AACCCGGACG CATTTATTGT CTATAAACCC 
CATCCTGACG TCCTGTCGGG CAATCGCCGC GGCTTAATAG AAGCGGCAGC TCTCGCCGAC 
GTGATGGAGC AGGACTCTGA TCTGATTTCG CTGATTGAGA TAGCGGATGA AGTGCACACG 
CTTTCTTCGC TGTCTGGTTT TGAAGCGTTG ATTCGCCGGA AAGCTGTCTT CACATATGGA 
CTGCCCTTTT ATGCAGGCTG GGGGTTGACA CACGATGCGC TCGCACCACC TTGGCGCGAT 
CGCAAGCTCT CGCTCGATAT GCTGACGGCA GGTGTATTGC TGCGCTACCC GATCTATTGG 
GATTGGACTC TTCATCTGTT TACATCGCCC GAAGCCATCG TTCGAAAATT GGCGATACCT 
GCGAAACGCC CACTCGTGAA AATTCGAGGT AATCGTTTGC GCCCACTTCT AAAAGCAATT 
CGTTGGAGCA GGAATGGACT CCAGCACCTC GCATGGCGTT GCAGTCAATG A

Protein sequence

MSRSPTIHTH SWPNGIMPRK KGPALSWFTT SLESETADGW IGRIDAELAT LSAIGSALNI 
TRLVERFRAA NVFDPSSCAT RIPLGLLERG TAQRVLVLDE PASVYLQAPR RERERQFSRM 
LAAVHREQPE AEIWFARSGI SSSGEWLSSS HPGIRGSNRY IDTSESLCAS LPYFDHVYTL 
SAVEGMQALL CGVPVHVFGM PYYAGWGLTH DDAPQPARQS HATLESLFEV VFIRLSRHLA 
PAGKTSDSLE ALLDAIEAHR ATVLRFADIR HVAGIRFQWW KRPFATPFLT AGGGTLRWTD 
DASKLAEGEH AAFWGARSTE GLPPDTPAVR IEDGFLHSIG LGSDHVAPCS QIIDRRGLYF 
DPSRPSDLTV ILNETDFNET ELARADALRN EITRLGLTKY NLGRRKPAWH APPGKRVVLV 
PGQVADDASI RLGTRGITTT EELLRTVRAH NPDAFIVYKP HPDVLSGNRR GLIEAAALAD 
VMEQDSDLIS LIEIADEVHT LSSLSGFEAL IRRKAVFTYG LPFYAGWGLT HDALAPPWRD 
RKLSLDMLTA GVLLRYPIYW DWTLHLFTSP EAIVRKLAIP AKRPLVKIRG NRLRPLLKAI 
RWSRNGLQHL AWRCSQ