Gene BamMC406_5776 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BamMC406_5776
Symbol
ID	6182521
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia ambifaria MC40-6
Kingdom	Bacteria
Replicon accession	NC_010557
Strand	+
Start bp	303461
End bp	304669
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	68%
IMG OID	641688912
Product	ectoine utilization protein EutD
Protein accession	YP_001815771
Protein GI	172065059
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID	[TIGR02993] ectoine utilization protein EutD

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.230868
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGCAG TCATCGAAAC CCACCAAGCC GTGCCACGCC TCGCGTTCGA GCGCAGCGAA 
TACGCCGCGC GCATCGCGAA GACGCGCACG GCGATGCAGC GGGCCGGCAT CGACCTGTTG 
ATCGTCACCG ACCCGACCAA CATGGGCTGG CTCACCGGCT ATGACGGCTG GTCGTTCTAC 
GTACACCAGT GCGTGCTGCT GCCGATGGAC GGCGAGCCCG TCTGGTACGG CCGCGGCCAG 
GACGCGAACG GCGCGAAGCG CACCGTGTTC ATGGCGCACG AGAACATCGT CGGCTACCCG 
GATCACTATG TGCAGTCGAC GGCCCGTCAC CCGATGGACT ACCTGTCGAC CGACGTGATT 
GCCGCACGCG GCTGGAGCAC GCTGCGCATC GGCGTCGAGC TCGACAACTA TTACTTCAGC 
GCGGCGGCGT ACGCGTCGCT GCAGAAGCAT CTGCCGGCCG CGCGCTGGGT CGACGCGACC 
GCGCTCGTGA ACTGGCAGCG CGCGGTGAAG TCGCCGCGCG AGATCGAGTA CATGCGCGTT 
GCCGCACGGA TCGTCGAGCG CATGCATGCG CACATCGTCG ACACGATCGA GCCCGGCATG 
AAGAAGAGCG ATCTCGTCGC GCAGATCTAT GCGACCGGGA TCGGCGGCGC GGACGGCTTC 
GGCGGCGACT ATCCGGCGAT CGTCCCGCTG CTGCCGACCG GCGCCGATGC GGCCGCGCCG 
CACCTGACGT GGGACGACAC GACGTTCGCG CGCGGCGCGG GCACGTTCTT CGAGATCGCG 
GGCTGCTACC GCCGCTATCA CTGCCCGCTG TCGCGCACCG TCTATCTCGG CAAGCCGCCC 
GCGCACTTCA TCGAAGGCGA GCGCGCGGTG GTCGAAGGGA TCGAAGCCGG GCTCGCGGCC 
GCGAAGCCCG GCAACGTGTG CGAGGACATC GCGAACGCGT TCTTCGCGGT GCTGCGCCGC 
GCGGGCATCG AGAAGGACAG CCGCTGTGGC TACCCGATCG GCGCGAGCTA TCCGCCGGAC 
TGGGGCGAGC GCACGATGAG CCTGCGCCCG GGCGACCGCA CGGTGCTCGA ACCCGGCATG 
ACGTTCCATT TCATGCCGGG GCTGTGGCTC GACGACTGGG GTCTGGAGAT CACTGAAAGC 
ATCCTGATCA CCGACACCGG CGTCGAGACG TTCTGCAACA CGCCGCGCAA GCTGTTCGTG 
AAGGAGTAG

Protein sequence

MSAVIETHQA VPRLAFERSE YAARIAKTRT AMQRAGIDLL IVTDPTNMGW LTGYDGWSFY 
VHQCVLLPMD GEPVWYGRGQ DANGAKRTVF MAHENIVGYP DHYVQSTARH PMDYLSTDVI 
AARGWSTLRI GVELDNYYFS AAAYASLQKH LPAARWVDAT ALVNWQRAVK SPREIEYMRV 
AARIVERMHA HIVDTIEPGM KKSDLVAQIY ATGIGGADGF GGDYPAIVPL LPTGADAAAP 
HLTWDDTTFA RGAGTFFEIA GCYRRYHCPL SRTVYLGKPP AHFIEGERAV VEGIEAGLAA 
AKPGNVCEDI ANAFFAVLRR AGIEKDSRCG YPIGASYPPD WGERTMSLRP GDRTVLEPGM 
TFHFMPGLWL DDWGLEITES ILITDTGVET FCNTPRKLFV KE