Gene Bcep18194_A4756 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bcep18194_A4756
Symbol
ID	3749964
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia sp. 383
Kingdom	Bacteria
Replicon accession	NC_007510
Strand	+
Start bp	1751923
End bp	1752960
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	67%
IMG OID	637763053
Product	peptidyl-arginine deiminase
Protein accession	YP_368995
Protein GI	78066226
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2957] Peptidylarginine deiminase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.322594
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.669249
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTCGCT TTGATGCTCG CCAGCGCGGT TACCGGATGC CCGCGGAATG GGAATCCATG 
GATGCCACGT GGCTCGGATG GCCGGTTCTC CACGATCGCG AGGATCTGTG GGGGAGCCAT 
TACGCGCAGG TGTGTCGCGA ATTCGCGCTG GTCGCGCGGA CGATCGCCCG CTACCAGCGC 
TGCGTGGTGG CCGCGCACCA CAGCCAGGCC GACGCGGCGC GCGAACTGGT GGGCGCGAGC 
GTCGACGTGG TGCCGGTCGC GGCCGAAGAC AACTGGCTGC GCGACTGCGG GCCGATCTTC 
CTCGTGAGCG AACAGCACGG GCTGGGCGCG GCCGTGTTCC GCTTCAACTG CTGGGGCGAG 
AAGTACCAGC CGTACGACGG CTGCCAGCAG GCCGGGCAGG ACATCGCGCG CGCGGCCGGC 
GCGGAGATCT TCAATTCGCA CATGGTGCTG GAGGGCGGCT CGTTTTACGT CGACGGGCAG 
GGCACACTGG TCACCACCGA GAGCTGCCTG CTGCATCCGA ATCGCAATCC GCACCTGAGC 
CGCGCGGAAA TCGAGGCGGA GCTGCGCCGC ATGCTGGGCG TCGAGAAGAT CATTTGGCTG 
CCGGGCAATC CCGACGAAGT GGAGACGAAC GGGCACGTGG ACGGCATCGC GTCGTTCATC 
GCACCCGGCC GGATGCTGTG CCAGACCGCG CTGCCGGAGC AGGGCGACTA TTTCCACGTG 
ATGCGGGAAA ACCGTCGCGC GCTGGAGCTC GCGACCGATG CGGCGGGGCG CCGTTTCGAG 
CTGCTCGACC TGCCGTCGCC GATCGTCACC GAACGCTTCG GCTCCGAGCG CTACTGCGAT 
TGCTATGCGA ACTACATCCT GGTGAATGGC GCGGTGATCG TGTCCGCGTT CGGCGTCGAG 
CAGGATCAGG CCGCGCGCGA GGCGTTCAGT CGTGCGTTCC CGGGGCGTAA CGTGGAGATG 
CTGCCGATTC CGACGCTGTC GATCGGCGGC GGCAGCATCC ACTGTTCGAC GCAGCAACAG 
CCGTCCGTCG CGAACTGA

Protein sequence

MGRFDARQRG YRMPAEWESM DATWLGWPVL HDREDLWGSH YAQVCREFAL VARTIARYQR 
CVVAAHHSQA DAARELVGAS VDVVPVAAED NWLRDCGPIF LVSEQHGLGA AVFRFNCWGE 
KYQPYDGCQQ AGQDIARAAG AEIFNSHMVL EGGSFYVDGQ GTLVTTESCL LHPNRNPHLS 
RAEIEAELRR MLGVEKIIWL PGNPDEVETN GHVDGIASFI APGRMLCQTA LPEQGDYFHV 
MRENRRALEL ATDAAGRRFE LLDLPSPIVT ERFGSERYCD CYANYILVNG AVIVSAFGVE 
QDQAAREAFS RAFPGRNVEM LPIPTLSIGG GSIHCSTQQQ PSVAN