Gene BURPS1106A_1987 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_1987
Symbol	arcA
ID	4903100
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	1951295
End bp	1952572
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	67%
IMG OID	640135217
Product	arginine deiminase
Protein accession	YP_001066252
Protein GI	126453511
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2235] Arginine deiminase
TIGRFAM ID	[TIGR01078] arginine deiminase

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.223306
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGATCGAAG AGGTAATCAA CATGTCCCAA GCCATCCCTC AAGTCGGTGT CCATTCCGAA 
GTCGGCAAGC TGCGCAAGGT GCTCGTCTGC TCGCCGGGCC TCGCGCATCA GCGCCTCACG 
CCGAGCAACT GCGACGAGCT GCTGTTCGAC GACGTGATGT GGGTGAACCA GGCGAAGCGC 
GATCACTTCG ATTTCGTCTC GAAGATGCGC GAGCGCGGCG TCGAGGTGCT CGAGATGCAC 
AACCTGCTGA CCGAGACCGT GCAGAACCCG GCCGCGCTCA AGTGGATCCT CGATCGCAAG 
ATCACGCCGG ATAACGTCGG CATCGGCCTC GTCGACGAAG TGCGCGCGTG GCTCGAGGGC 
CTCGAGCCGC GTGCGCTCGC CGAGTTCCTG ATCGGCGGGG TCGCGGCGAG CGACATTGCC 
GGCGCCGAGC GCTCGAAGGT GCTTACGCTG TTTCGCGACT ATCTCGGCAA GTCGTCGTTC 
GTGCTGCCGC CGCTGCCGAA CATGATGTTC ACGCGCGACA CGTCGTGCTG GATCTACGGC 
GGCGTCACGC TCAACCCGAT GCACTGGCCC GCGCGCCGGC AGGAGACGCT CCTCGTCGCC 
GCCGTCTACA AATTCCACCC GGCGTTCACC GACGCGAAGT TCGACGTCTG GTACGGCGAT 
CCCGACCGCG ATCACGGCAT GGCGACGCTC GAAGGCGGCG ACGTGATGCC GATCGGCCGC 
GGCGTCGTGC TCGTCGGCAT GGGCGAGCGC ACGTCGCGCC AGGCGGTCGG CCAGCTCGCG 
CAGGCGCTGT TCGCCAAGGG CGCGGCCGAG CGCGTGATCG TCGCCGGGCT GCCGAACTCG 
CGCGCGTCGA TGCACCTCGA CACCGTGTTC AGCTTCTGCG ACCGCGATCT CGTCACGGTC 
TTCCCCGAAG TCGTGAACCG GATCGTGCCG TTCACGCTGC GCCCGGGCGG CGATGCGCGT 
TACGGCATCG ACATCGAGCG CGAGGACAAG CCGTTCGTCG ACGTCGTCGC GCAGGCGCTC 
GGCCTCAAAT CGCTGCGCGT CGTCGAGACG GGCGGCAACG ATTTCGCGGC CGAACGCGAG 
CAATGGGACG ACGGCAACAA CATGGTGTGC ATCGAGCCGG GCGTCGTCGT CGGCTACGAC 
CGCAACACGT ACACGAACAC GCTGCTGCGC AAGGCGGGCG TCGAGGTGAT CACGATCGGC 
TCGAGCGAGC TCGGCCGCGG CCGAGGCGGC GGCCACTGCA TGACCTGCCC GGTGCTGCGC 
GACCCCGTCG ACTACTGA

Protein sequence

MIEEVINMSQ AIPQVGVHSE VGKLRKVLVC SPGLAHQRLT PSNCDELLFD DVMWVNQAKR 
DHFDFVSKMR ERGVEVLEMH NLLTETVQNP AALKWILDRK ITPDNVGIGL VDEVRAWLEG 
LEPRALAEFL IGGVAASDIA GAERSKVLTL FRDYLGKSSF VLPPLPNMMF TRDTSCWIYG 
GVTLNPMHWP ARRQETLLVA AVYKFHPAFT DAKFDVWYGD PDRDHGMATL EGGDVMPIGR 
GVVLVGMGER TSRQAVGQLA QALFAKGAAE RVIVAGLPNS RASMHLDTVF SFCDRDLVTV 
FPEVVNRIVP FTLRPGGDAR YGIDIEREDK PFVDVVAQAL GLKSLRVVET GGNDFAAERE 
QWDDGNNMVC IEPGVVVGYD RNTYTNTLLR KAGVEVITIG SSELGRGRGG GHCMTCPVLR 
DPVDY