Gene Bind_1056 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bind_1056
Symbol
ID	6201139
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Beijerinckia indica subsp. indica ATCC 9039
Kingdom	Bacteria
Replicon accession	NC_010581
Strand	+
Start bp	1212596
End bp	1213621
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	61%
IMG OID	641705049
Product	PhoH family protein
Protein accession	YP_001832188
Protein GI	182678042
COG category	[T] Signal transduction mechanisms
COG ID	[COG1702] Phosphate starvation-inducible protein PhoH, predicted ATPase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.563658
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.821458
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGGCCC TTCCTTCAGG AGAGCCGACG GCCGAGATGA CCCTCGCCTT TGACGATAAT 
CGTTATGCCT TATTGGTCTT TGGCCAATAT GACCAGAACA TTGCCAAGGT TGAACGCCGC 
CTGGGTGTCA GCGCTCATGC CAATGGCAAT CATATTACCA TCAAGGGGCC GCAAGGCGCT 
TGTGAGCAGG CCCGCCGCGT GTTCGAATCG CTTTATGCGC GGGTCAAGCT CGGCCATCCG 
ATCAGCCTTG GTGATGTCGA TGGCGCGATC GAGGAAGGCG TGGTGCAAGG CAGCTTGTTT 
CCAGGCGAGA GCGAGGTCGG TCGCCCGGTT TTTGAACAGA TCGCGACGCG GCGACGTGGC 
CCGGTGCGCG CCCGCACGGC CGCCCAGGAT TATTACTTGC GAACTTTGAA ACAATCGGAG 
CTGGTTTTCG CCGAGGGACC GGCCGGCACG GGCAAGACGT GGCTCGCCGT GGGTTTTGCT 
GTGTCTCTCC TCGAACAAGG CCGTGTCGAT CGGCTGATCC TGTCGCGGCC TGCCGTCGAA 
GCGGGTGAGC GTCTGGGCTT TCTGCCGGGC GATATGCGCG ACAAGGTCGA TCCTTATCTG 
CGGCCGATCT TCGATGCCTT GAATGATTTC ATGGACCCTC GCCTCCTGGA GCGGGGCATG 
CAGACTGGTA TGATCGAGGT GGCGCCGCTT GCCTTCATGC GCGGGCGCAC TTTGAGCAAT 
GCCTGCGTCT TGCTCGACGA GGCGCAGAAC GCGACCTCGA TCCAGATGAA GATGTTTCTG 
ACGAGACTGG GTGAAAATTC GCGCATGATC GTCACCGGCG ATCCGACCCA GACCGATCTG 
CCGTCCACGC AGAAATCCGG CCTGAGCGAG GCGATCAACC TTTTGTCGGA GCTTGAAGGC 
GTGGGGCACG TCGTTTTTCG CGAAGGCGAT GTCGTGCGGC ATGATCTGGT GCGCCGTATC 
GTCGGCGCTT ATGAAGCCGC GTCGCGCGGC GACAACGAGT CGGCAAGACC CATCGGGAGA 
GCATGA

Protein sequence

MPALPSGEPT AEMTLAFDDN RYALLVFGQY DQNIAKVERR LGVSAHANGN HITIKGPQGA 
CEQARRVFES LYARVKLGHP ISLGDVDGAI EEGVVQGSLF PGESEVGRPV FEQIATRRRG 
PVRARTAAQD YYLRTLKQSE LVFAEGPAGT GKTWLAVGFA VSLLEQGRVD RLILSRPAVE 
AGERLGFLPG DMRDKVDPYL RPIFDALNDF MDPRLLERGM QTGMIEVAPL AFMRGRTLSN 
ACVLLDEAQN ATSIQMKMFL TRLGENSRMI VTGDPTQTDL PSTQKSGLSE AINLLSELEG 
VGHVVFREGD VVRHDLVRRI VGAYEAASRG DNESARPIGR A