Gene Bcep18194_A5158 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bcep18194_A5158
Symbol
ID	3750367
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia sp. 383
Kingdom	Bacteria
Replicon accession	NC_007510
Strand	+
Start bp	2204539
End bp	2206215
Gene Length	1677 bp
Protein Length	558 aa
Translation table	11
GC content	67%
IMG OID	637763454
Product	glycosyl transferase family protein
Protein accession	YP_369396
Protein GI	78066627
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1807] 4-amino-4-deoxy-L-arabinose transferase and related glycosyltransferases of PMT family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.636503
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.791629
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGATA CGCCGTCGAG GCTACCGCTC AATCGCATCA CGCTCGTCCT CCTCGTCGTC 
GCACTCGCGA TCGTCTGGTT CGCGCCGCTC GGGCTGCGCC ACCTGATCCC GAGCGACGAA 
GGCCGCTACG CGGAAATGGC GCGCGAGATG TTCGTCACCG GCGACTGGAT CACGCCGCGC 
TACAACGGCT ACAAGTATTT CGAGAAGCCG CCGCTGCAAA CCTGGCTGAA CGCGCTCACG 
TTCGCGTGGT TCGGCATCGG CGAATGGCAG GCGCGCCTCT ACACGGCCGT CGCGAGCTTC 
GCCGGCATCC TGCTGGTCGG CTACACCGGC GCGCGCCTGT TTAACCCGCT GTCGGGCTTC 
CTCGCCGCCG TCGTGCTCGC GTCGTCGCCG TACTGGAACC TGATGGGCCA CTTCAACGCG 
CTCGACATGG GGCTCGCGTT CTGGATGTCG CTGTCGCTGT GCTCGCTGCT GCTCGCGCAG 
CGGCCCGGGC TGCGCCCGGC CGCGGCACGC GGCTGGATGT GGGCGTGCTG GGGCGCGATG 
GCGTTCGCGG TGCTATCGAA GGGCCTCGTC GGCCTGATCC TGCCCGGCGC CGTGCTCGTG 
CTCTATACGC TGATCGCACG CGACTGGGCG CTCTGGAAGC GCCTGTACCT GGTGAGCGGC 
CTCGTGATCT TCTTCGCGAT CGTCACGCCG TGGTTCGTGC TCGTCCAGCA GCGCAATCCC 
GAATTCTTCA ACTTCTTCTT CATCGTCCAG CAGTTCCGCC GGTACCTGAC CCCGGAACAG 
AACCGCCCGG GCCCGGTTTA CTACTTCGTG CCCGTGCTGC TGGTCGGCTT CCTGCCGTGG 
CTGTCGGTCG CGTGGCAGAG CCTCCGCCAT GCGCTGCGGA TGCCGCGCCA GCCGAATGGC 
TTCGCGCCGA TGCTCGTGCT GCTGATCTGG AGCGCATTCA TCTTCCTGTT CTTCAGCGCG 
TCGCATTCGA AGCTGATCTC GTACGTGCTG CCGATCGCGC CGGCGCTCGC GCTGGTCATC 
GGCGCGTACC TGCCGCTGAT CAGCGCCGAC CGGTTCCGCC GCCACCTGCT CGGCTACCTC 
GTATTCATCG TCGTCGCGGC GTTCGGGATC ATCTTCCTCG CGTACCAGGG CGATGCCCGC 
ACGCCGAACG CGCAGTACCG CGCGTTCCAG ATGTGGCTGT ACGGGGGCCT CGCAGTCGCA 
GCCGTACTGA CGCTCGCGGC CGCCTGGCTG AACCGCCGCA CGGGCGTCGC TGCCGCGCTC 
GCCGCGTTCG GCGCCGCCTG GCTCGCGTTC GGCACGATCG GCGGCACCGG TCATGACGAA 
TTCGGCCGCT ACAGCTCGGG CGCGCTGCTC GCACCGGCCG TGCGCGCCGA ACTGGCGAAG 
CTGCCGCCCG ACACGCCGTT CTACTCGGTC GAAATGCTCG ATCACACGTT CCCGTTCTAT 
ATGGGCCACA CGACGATCAT GGTCCAGCGC CAGGACGAGC TCGCGTTCGG GATCTCGATG 
GAGCCGAACA AGTGGATTCC GACCGTCGAC GAGTGGATCA CGCGCTGGAA ACAGGAAACC 
CATGCGCTCG CGATCATGTC GCCCGGCCAG TACGACACCC TGGTCAAGCA AGGCGTGCCG 
ATGCGCGTGG TCGCGCGCGA CAACCGCCGC GTGATCGTCG AGAAACCGCA ATCGTAA

Protein sequence

MNDTPSRLPL NRITLVLLVV ALAIVWFAPL GLRHLIPSDE GRYAEMAREM FVTGDWITPR 
YNGYKYFEKP PLQTWLNALT FAWFGIGEWQ ARLYTAVASF AGILLVGYTG ARLFNPLSGF 
LAAVVLASSP YWNLMGHFNA LDMGLAFWMS LSLCSLLLAQ RPGLRPAAAR GWMWACWGAM 
AFAVLSKGLV GLILPGAVLV LYTLIARDWA LWKRLYLVSG LVIFFAIVTP WFVLVQQRNP 
EFFNFFFIVQ QFRRYLTPEQ NRPGPVYYFV PVLLVGFLPW LSVAWQSLRH ALRMPRQPNG 
FAPMLVLLIW SAFIFLFFSA SHSKLISYVL PIAPALALVI GAYLPLISAD RFRRHLLGYL 
VFIVVAAFGI IFLAYQGDAR TPNAQYRAFQ MWLYGGLAVA AVLTLAAAWL NRRTGVAAAL 
AAFGAAWLAF GTIGGTGHDE FGRYSSGALL APAVRAELAK LPPDTPFYSV EMLDHTFPFY 
MGHTTIMVQR QDELAFGISM EPNKWIPTVD EWITRWKQET HALAIMSPGQ YDTLVKQGVP 
MRVVARDNRR VIVEKPQS