Gene Bcep18194_A4759 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bcep18194_A4759
Symbol
ID	3749967
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia sp. 383
Kingdom	Bacteria
Replicon accession	NC_007510
Strand	+
Start bp	1755121
End bp	1756233
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	68%
IMG OID	637763056
Product	peptidyl-arginine deiminase
Protein accession	YP_368998
Protein GI	78066229
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2957] Peptidylarginine deiminase and related enzymes
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.675137
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.251109
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAACGA GACGTCAACT GTTGAAACGC GGCCTGTCCG TATCTGGGGC GGCGCTGGCC 
GCCAGCGCGC TGGGCGGGTT GCTCGGCCGC GCCGCGCACG CGCAGCAGGG CGCAACCTGG 
CACATGCCGG ACGAGGGTGC GCCGCACACG GCGACGTGGA TGGCGTTCGG CCCGAGCGAG 
GACATCTGGG GTGCGCGGCT GTTGCCCGTC GCGCGCGCGA ACCTGGCCGC GATCGCGAAG 
GCGATCGCCG CGCACGAGCC GCTCAAGATG CTGGTGCGCG AGCAGGACTA CGCAATCGCG 
TCGCGGCTGT GCGGTTCATC GGTCGAGCTC GTCCAGCATC CGGTCGACGA TCTGTGGATG 
CGCGACACGG GGCCCGTGTT CGTGAAGAAC GCGTCGGGCC AGCTCGGCGG CGTGAGCTTC 
AATTTCAACG GCTGGGGCAA CAAGCAGGAG CACGACCAGG ACGCGGAAGT CGCGCCGTTC 
GTGGCGGAGC GCGCCGGTGC ACGGCTGCTC GACACACGGC TGGTGCTCGA AGGCGGCGGC 
ATCGAGGTGG ACGGCGAAGG CACGGCGATC ATCACGCGCA GCTGCGTGCT CAATTCGAAC 
CGCAATCCGG GCGTCGGCCA GGCACAGTGC GAGGCGGAGC TGAGCCGGCT GCTCGGGCTG 
AAGAAGATCA TCTGGCTGCC GGGCATCGCG GGCAAGGACA TCACCGACGG GCATACCGAT 
TTCTATGCAC GCTTCACGAG CCCGGGCGTC GTGGTGGCGG GGCTCGATAC CGATCCGTCG 
TCGTACGATC ACGCGGTGAC GCGGCAGCAT CTGGAGATCC TGCGGAAATC GACCGATGCG 
AAGGGCCGCC CGTTGAAAGT CGTCGTACTG CCGGGCCCGA AGTCCGTCCG GCATCAATAC 
GAGAACGAGG AATTCGCGGC AGGTTATATC AACTTCTACG TGTGCAACCG CGCAGTGATC 
GCCCCGCAAT TCGGCGACAG CCGCGCCGAC CGCAATACGC GCGACACGCT CGTCGACCTG 
TTTCCGGGGC GCGAGGTCAT CCAGCTGAAC ATCGACGGCA TCGCCGCGGG CGGCGGCGGC 
ATCCACTGCA CCACGCAGCA GCAGCCGGCC TGA

Protein sequence

MTTRRQLLKR GLSVSGAALA ASALGGLLGR AAHAQQGATW HMPDEGAPHT ATWMAFGPSE 
DIWGARLLPV ARANLAAIAK AIAAHEPLKM LVREQDYAIA SRLCGSSVEL VQHPVDDLWM 
RDTGPVFVKN ASGQLGGVSF NFNGWGNKQE HDQDAEVAPF VAERAGARLL DTRLVLEGGG 
IEVDGEGTAI ITRSCVLNSN RNPGVGQAQC EAELSRLLGL KKIIWLPGIA GKDITDGHTD 
FYARFTSPGV VVAGLDTDPS SYDHAVTRQH LEILRKSTDA KGRPLKVVVL PGPKSVRHQY 
ENEEFAAGYI NFYVCNRAVI APQFGDSRAD RNTRDTLVDL FPGREVIQLN IDGIAAGGGG 
IHCTTQQQPA