Gene Bphyt_4901 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bphyt_4901
Symbol
ID	6279615
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia phytofirmans PsJN
Kingdom	Bacteria
Replicon accession	NC_010676
Strand	-
Start bp	1025758
End bp	1027098
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	65%
IMG OID	642615987
Product	HipA N-terminal domain protein
Protein accession	YP_001888635
Protein GI	187919604
COG category	[R] General function prediction only
COG ID	[COG3550] Uncharacterized protein related to capsule biosynthesis enzymes
TIGRFAM ID	[TIGR03071] HipA N-terminal domain

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.069886
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.125288
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTCGCC AAACTCACTC ACGCGCACTG TCGGTATGGG CCAACGGCGA GCGCGTCGGC 
GTCTGGCGCC TGCCCGCTCG CGGGCCCATG GAGCTCGCCT ACGATCCCGC GTGGGTCGCC 
TCGCCGGCGG GACGGCCGCT GTCGCTGTCG CTGCCGTTCA CGCCGGGCAA TCTGGCGCAA 
AAAGGCCCGC GCGTTCTCAA CTATTTCGAC AACCTGCTGC CCGACAGCGA GGCGATCCGA 
AAGCGCATCG CCCAACGCTA CCAGACCGAG ACGCTCGATG CGTTCGATCT GCTGCAAGCC 
ATCGGCCGCG ACTGCGTGGG CGCCGTCCAG CTGCTCGCCG AAGACGACGT GCCGCAAGGC 
GTCGAGCAAA TCGAGGGCAC GCCGCTCACT GACAGCGAAA TCGAGACCAT GCTGGCGCGC 
ACGGTCGGCA ACCCCGCGCT CGGCGCACCA GACCAGACGG ACGATTTCCG CATCTCGCTC 
GCCGGCGCGC AGGAAAAAAC CGCGCTGCTG TGGCATGACG GCAAGTGGCA GCGGCCGCAT 
GGCGCCACGC CCACCACGCA CATTTTCAAG CTGCCGCTCG GCCTTGTCGG CAACAAGCTC 
GCCGACCTCA GCACCTCGGT CGAAAACGAG TGGCTCTGTC TGCGGATTCT GCGCGCCTAC 
GGCCTGCCGG TCGCCAATAC GGAGATCATG ACGTTCGGCA AACAGCGGGT ATTGAGTGTC 
GAGCGCTTCG ACCGGCAAAT GCATTCGAGC GGGCAATGGC TGCTGCGTCT GCCGCAGGAA 
GACTTCTGCC AGGTGTACGG CGTGCCGTCG CATCGCAAAT ACGAAAACGA AGGCGGCCCT 
GGTGTGCTCG ACCTCGCGCG AATTCTGCAG CAATCGGTCG AGGCGCGGCA GGACATCGAG 
ACGCTGCTGG CGAGCCAGAT TCTGTTCTGG ATGCTGGCGG CGCCGGACGG CCACGCCAAG 
AATTTCAGCA TCCGCCTGCT GGCGGGTGGC CACTACCGGC TCACACCGCT TTACGACGTG 
ATGTCGATCT GGCCGGTGGA AGGCAGCGGC CCGAACCAGT GGTCATGGTT CAAGGCGCGG 
CTCGCCATGG GCATGTGGTC GCGCAGCAAG CACGACGCGT TTCGCGACGT GCAGCGGCGG 
CACTTCAACA CCATGGCGCT GAAGTGCTCG TACGGCGCGG ACGCGGAACC GCTGATCCAG 
CGGTTGATCG AGCAGACTCC CGGCGTGATC GAGCGGGTCT CCGCGGAATT GCCCGAACGT 
TTTCCGGCCA AGGTCGCCGA ACGGATTTTC AAAGGCCTGA AAAACTCGGC GGCGAAGCTC 
GGCACGATGT CTGCTGGCTA G

Protein sequence

MGRQTHSRAL SVWANGERVG VWRLPARGPM ELAYDPAWVA SPAGRPLSLS LPFTPGNLAQ 
KGPRVLNYFD NLLPDSEAIR KRIAQRYQTE TLDAFDLLQA IGRDCVGAVQ LLAEDDVPQG 
VEQIEGTPLT DSEIETMLAR TVGNPALGAP DQTDDFRISL AGAQEKTALL WHDGKWQRPH 
GATPTTHIFK LPLGLVGNKL ADLSTSVENE WLCLRILRAY GLPVANTEIM TFGKQRVLSV 
ERFDRQMHSS GQWLLRLPQE DFCQVYGVPS HRKYENEGGP GVLDLARILQ QSVEARQDIE 
TLLASQILFW MLAAPDGHAK NFSIRLLAGG HYRLTPLYDV MSIWPVEGSG PNQWSWFKAR 
LAMGMWSRSK HDAFRDVQRR HFNTMALKCS YGADAEPLIQ RLIEQTPGVI ERVSAELPER 
FPAKVAERIF KGLKNSAAKL GTMSAG