Gene BURPS1106A_A1764 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A1764
Symbol
ID	4904172
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	-
Start bp	1737223
End bp	1738578
Gene Length	1356 bp
Protein Length	451 aa
Translation table	11
GC content	76%
IMG OID	640144870
Product	aminopeptidase DmpA
Protein accession	YP_001075798
Protein GI	126458057
COG category	[E] Amino acid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3191] L-aminopeptidase/D-esterase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.12986
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCGCGC GCACATCGGG CCGGGCGGAT GCGGCTGAGG CGCTCGACGC CGCCGATGCC 
GCGCCGCACG TCGGCGCGCT GCCGGCCGGG CCGCTTCGCA GCATCGCCGA CGTCGCCGGC 
GTGACGGTCG GCCACGCGAC GCTCGACGCG CGCGGCGTGC AGACCGGCGT GAGCGTCGTG 
CGGCCGCACG CGGGCGACGT CTATCGCGAC AAGGTGCCCG CCGCGGCCGC GGTGATCAAC 
GGCTTCGGCA AGAGCATCGG GCTCGTGCAG GTCGACGAGC TCGGCGTGCT GGAGACGCCG 
CTCGCACTGA CGAACACGTT CGGCGTCGGC GCGCTCGCGC AAGCGCAGAT CCGCGCGGCG 
ATCGATGCGA ATCCGCAGAT CGGCCGCGCG TGGCCGAGCG TCAATCCGCT CGTGTTCGAA 
TGCAACGACG GCTATCTGAA CGACCTGCAC GCGTTCGCGG TGACGCCCGC GCATTACGCG 
CAGGCGCTCG CCGATGCGCG GCGCGCGTTC GCGCGCGGCG CGGTGGGCGC GGGGCGGGGG 
ATGTCGTGCT TCGACCTGAA GGGCGGGATC GGGTCGGCGT CGCGCGTCGT ACGCGCGGCG 
GGCGAAGCGT GGACGGTGGG CGCGCTCGTG CTCGCGAACT TCGGGCGATT GCCGATGCTG 
ACGATCGCCG GCGTGCCGGT GGGGCGGATG ATCGCCGAGC GGGATGCGGG CGGCGCGCCC 
GGGGCGGGCG GCGGACAGGG CGCGGACGGC GCGCGGGATG ATGTCGCGGC GGCGGGCGCG 
AGGGGCGCGA GGGGCGAGAG GGGCGAGAGG GGCGAGAGGG GCGATGGGCC GCATGGGACA 
TACGGGACAT ACGGGGCGCA CGGCCGCGAG AATGCCGGCA CGGGCGGCGG TGCGGCCGGC 
GGCCTCGCGC CGCGCCGCGC GCGCGACGCC GGCGCTTCCT CGCCGGGCGC AGCGCCGGAC 
GCTGCGCCGC CCGAACAAGG CTCGATCATC ATGCTCGTCG CCACCGATGC GCCGCTGTCG 
TCGCGGCAAC TGAAGCGCGT CGCGCTGCGC GCGGCCGTGG GCCTCGCGCG CACGGGCTCG 
GTGTACGGCC ACGGCAGCGG CGACATCGCG CTTGCGTTCT CGACCGCGTA CACGGTGCCG 
CACGACGCCG AGCGCGTCTC GCTGCCGGCG CTTGTCGCGG ATGCGGCGCT CGATCCGCTG 
TTCGCCGCGG CGGCCGACAG CGTCGAGCAG GCGATCGTCG ACGCGCTGTG GCGCGCGACG 
CGCGTCACCG GCCGCGACGG TCACACACGG CGCGCGTTGC GCGACGCCGC GCCGGAACTC 
GAACGATGGT TGCGCGCGGC GCGCGCGGGA GCATGA

Protein sequence

MRARTSGRAD AAEALDAADA APHVGALPAG PLRSIADVAG VTVGHATLDA RGVQTGVSVV 
RPHAGDVYRD KVPAAAAVIN GFGKSIGLVQ VDELGVLETP LALTNTFGVG ALAQAQIRAA 
IDANPQIGRA WPSVNPLVFE CNDGYLNDLH AFAVTPAHYA QALADARRAF ARGAVGAGRG 
MSCFDLKGGI GSASRVVRAA GEAWTVGALV LANFGRLPML TIAGVPVGRM IAERDAGGAP 
GAGGGQGADG ARDDVAAAGA RGARGERGER GERGDGPHGT YGTYGAHGRE NAGTGGGAAG 
GLAPRRARDA GASSPGAAPD AAPPEQGSII MLVATDAPLS SRQLKRVALR AAVGLARTGS 
VYGHGSGDIA LAFSTAYTVP HDAERVSLPA LVADAALDPL FAAAADSVEQ AIVDALWRAT 
RVTGRDGHTR RALRDAAPEL ERWLRAARAG A