Gene Bxe_A3047 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bxe_A3047
Symbol
ID	4002154
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia xenovorans LB400
Kingdom	Bacteria
Replicon accession	NC_007951
Strand	+
Start bp	1542280
End bp	1543440
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	63%
IMG OID	637946594
Product	putative bacteriophage tail protein GP47,Mu-like
Protein accession	YP_557984
Protein GI	91782778
COG category	[S] Function unknown
COG ID	[COG3299] Uncharacterized homolog of phage Mu protein gp47
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	0.965464
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	0.000022489
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCCATATG CACGGAAAAC ACTCGCGCAG ATCCGGTCTG ACGCGATGGC GGACATTGCG 
GCCGCGCTGC AGGGCTCGGA TCCTCTCCTG CGGTTCGCGG CGCTAAAAAT CATCGGGGTT 
GTGCTCGCGG GCATGACCAA CGAGGAATAC GGGTACCTCG ACTGGATTGC GAAACAGACG 
AACCCTTTCA CGGCCGACGA CGAGTACCTC GAGGCGTGGG GGGCACTGAA GAAGGTCTAT 
CGCAAGGATG CGAGCGCCGC GAGCCTGTCA GCGACGTTCA CGGGCGTCGC CGGCAAGCTG 
CTCGACGACG GTACGCCGGT GGTGCGAAGC GACGGAGCAA CCTACACCAC GTCGGGCACG 
CAGACCGTCG TCGGGACTTC GGTCACAGTG ACGATCGTGG CCGACGTCGC GGGGGCTGCC 
GGCAATGCGG ATCCCGGTAC CGTCGTCGCT CTCGACATCG CAGTCGACGG CATTCAGTCA 
ACCGGCGCAG TCATTGGCAC AGTTTCGTCG GGCGCCGATA TCGAGGACCA GGAGGATTAT 
CGCGCGCGCG TATTGGCGAA GTATCAGCAG CCTCCGCAGG GCGGCGCGGC GCCGGATTAT 
GTGGAATGGG CGACTGACGT CGCTGGCGTC ACACGCGCAT GGTGCGCGCC CAACGGCTTC 
GGCGCTGGAA CTGTGGTCGT GTACGTCATG CTCGATGACG CGCAGGCAGC GCATGGTGGC 
TTTCCGCAAG GCACCGACGG GGTGTCGCAA CACGATCAGG GGCCCGGTGG TCTGCCGCGT 
GGAACGGTAG CGACCGGTGA TCAGTTAGTT GTCGCCGATG CAATCGTCAC GCTCCAGCCG 
GGTACGGCGC TCGTATGGAT TTGTTCACCT GTCGAGAACG TACTGTCGTT CGAACTGACC 
GGGTCGGCAG GATGGTCGAC GGCGATCCGG AACGCGGTCA AGGCGCAGAT TTCTGATGTC 
TTCTTTCGCA ACGGCGATCC GCGCGGCGGC ACGATCGACA GATCGGATAT CAATTCGGCG 
ATCGCTGCAG TGCCAGGAAC CGCTGGTTTC GTCATTACTT CCATCACCGG CGTGATATCC 
GGCACGCCGA CCACATACCC CGCAAATATC ACCGGCAGTT TCGGCTCGCT GCCCGTGCTC 
GGGGAAGTCA CTTTCGGCTG A

Protein sequence

MPYARKTLAQ IRSDAMADIA AALQGSDPLL RFAALKIIGV VLAGMTNEEY GYLDWIAKQT 
NPFTADDEYL EAWGALKKVY RKDASAASLS ATFTGVAGKL LDDGTPVVRS DGATYTTSGT 
QTVVGTSVTV TIVADVAGAA GNADPGTVVA LDIAVDGIQS TGAVIGTVSS GADIEDQEDY 
RARVLAKYQQ PPQGGAAPDY VEWATDVAGV TRAWCAPNGF GAGTVVVYVM LDDAQAAHGG 
FPQGTDGVSQ HDQGPGGLPR GTVATGDQLV VADAIVTLQP GTALVWICSP VENVLSFELT 
GSAGWSTAIR NAVKAQISDV FFRNGDPRGG TIDRSDINSA IAAVPGTAGF VITSITGVIS 
GTPTTYPANI TGSFGSLPVL GEVTFG