Gene Bcep18194_A5652 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bcep18194_A5652
Symbol
ID	3750880
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia sp. 383
Kingdom	Bacteria
Replicon accession	NC_007510
Strand	+
Start bp	2750131
End bp	2751411
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	68%
IMG OID	637763968
Product	O-antigen polymerase
Protein accession	YP_369890
Protein GI	78067121
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3307] Lipid A core - O-antigen ligase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTTCGT TTTCCGCTCC CGCCTCGCGG CGCCTGACCG CCGCCCGTGC ATTCGCCGTT 
GCCGCGCTCT GCATGGTGCC GGTCTCGACC GCGCTGACCA ACGTGTTCTG CGGGCTGTTC 
GCCGCCGCGC TCGTGATTTC CCCCGAGTTC TGGCGCGACC TGCGCTCGTT CGTCACCGAC 
CCGGCCTCGC TCGCGGCGCT GCTGATCCTG GCCGCGCTCG CCGCCAGCGT CACTTATACG 
GTTGCACCGC ACAACAAGGC GTGGAACTGG GTCGCCAAGT ACGACAAGCT GCTGCTGCTG 
CCGTTCGCCG TGCTCGCCTT CCGCCATTCG AACTGGGCAC CGATCGTCCG CCGTTGCTGG 
TTCGGCACGC TGTGCGTGAT CCTGCTGTTG TCGACCACGA ACTATCTCGG CCTGACCGCG 
ATCGGGCCCG CGCACGCGAC CGAACTGCCG CTGTCGCGCG CGTGGGTGTT CAAGAACCAC 
ATCGCCGCCG GCATGTTCGG CGCGCTGCTG TTCTACCAGG CGGCCGATCT CGCGCTGGCG 
GCCCGCACGG CGCTGTCGCG CGCCGCGTAT GCAGGCGTCG CCGCGTGGTC GCTCGTCAAC 
GTGTTCGTGA TGCTGCAGGG ACGCACCGGG CAGGTCATCG CGCTGCTGCT GATCCTCGTC 
GTCGCCGTAC GTTTCGTGCT GTTGCTGCGC CGGCAATCGG CGTTGCGCGC GGCGCTCGCC 
GCCGGCGTGT TCGTGCTGGC CGGCATCGCG CTCGTGATCG CCGCATGCAC GGTTCACAAC 
GGCCGGCTGA CGAAGGTCGT GACGGAAGTG CAGCAATACC GGCAGAGCGA TGCGGCCACG 
TCCACCGGGC TGCGCCTCGA GTGGTACAAG AAGGGGCTCG AGCTGTTTCG CCAGCGCCCG 
GTGATCGGCT ACGGCGCAGG CGGCCTCGAA TCCGAATTCG AGAAGCTCAC GGCCGGCAAG 
ACGGCGGCCG AAGGCCAGCT CACGTCGAAC CCGCACAATG AATACCTGCT GATGGCCGTA 
CAGCTCGGCG CGGTCGGCCT GCTGCTGTTC ATCAACCTGA TCGTGCAGAT TGCACGCGGC 
AGCCGCACGC TCGATCCGCG CTCGCGGCAT CTGCTGCTCG CCTGGCTCGC GATCTTCGCA 
ATCGGCAGTC TCGCGAATTC GCTGCTGCTC GATTTCGCCG AAGGGCACCT GATCGTGCTG 
CTGGCCGGCA TCCTGCTCGG CTGCGGCGAA CGCGCCGAGG CGCTGCCGCG CGAAACGTCG 
GCGATCCGGC GCAGCGCGTA A

Protein sequence

MLSFSAPASR RLTAARAFAV AALCMVPVST ALTNVFCGLF AAALVISPEF WRDLRSFVTD 
PASLAALLIL AALAASVTYT VAPHNKAWNW VAKYDKLLLL PFAVLAFRHS NWAPIVRRCW 
FGTLCVILLL STTNYLGLTA IGPAHATELP LSRAWVFKNH IAAGMFGALL FYQAADLALA 
ARTALSRAAY AGVAAWSLVN VFVMLQGRTG QVIALLLILV VAVRFVLLLR RQSALRAALA 
AGVFVLAGIA LVIAACTVHN GRLTKVVTEV QQYRQSDAAT STGLRLEWYK KGLELFRQRP 
VIGYGAGGLE SEFEKLTAGK TAAEGQLTSN PHNEYLLMAV QLGAVGLLLF INLIVQIARG 
SRTLDPRSRH LLLAWLAIFA IGSLANSLLL DFAEGHLIVL LAGILLGCGE RAEALPRETS 
AIRRSA