Gene Bpro_1047 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bpro_1047
Symbol
ID	4012265
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polaromonas sp. JS666
Kingdom	Bacteria
Replicon accession	NC_007948
Strand	-
Start bp	1073749
End bp	1074717
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	63%
IMG OID	637940725
Product	extracellular solute-binding protein
Protein accession	YP_547898
Protein GI	91786946
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.338181
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.286195
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTAAGA CAACCGTCAA GAAATTGGCT TCGCTGCTGG CGGCAGGCGC TTGCGCGGCC 
GGCATGGCCT CAGCCGCCGG GGCACAGGAA ACCAAGCTGA CGCTGGGCAT GTCTGGCTGG 
ACCGGCTTCG CCCCGCTGTC GCTGGCGGAC AAGGCCGGCA TCTTCAAGAA AAACGGCCTG 
GATGTGGAGA TCAAGTTCAT TCCGCAGAAA GACCGCCACC TGGCGCTGGC CGCCGGGGCC 
ATCCAGTGCG CAGCCACCAC CGTGGAAACC CATGTGGCCT GGAACGCCAA TGGCGTGCCC 
ATCGTGCAGA TCTTCCAGAT GGACAAATCC TATGGTGCCG ACGGCCTGGC CGTGCGTAAC 
GACATCAAGA GCTTTGCCGA CCTGAAGGGC AAGACCATCG GCGTGGACGC CCCGGGCACC 
GCGCCCTACT TCGGCCTGGC GTGGATGCTG AACAAAAACG GCATGACGCT CAAGGACGTG 
AAGACCACCA CCCTCTCGCC GCAGGCGTCT GCCCAGGCCT TTGTCGCGGG CCAGAACGAC 
GCGGCCATGA CCTACGAGCC CTACCTCTCC ACCGTGCGCG ACAACCCGGC CTCCGGCAAG 
ATCCTGGCCA CCACGCTGGA CTACCCCATG GTGATGGACA CGGTCGGCTG CGCGCCGACC 
TGGCTCAAGG CCAATCCCAA GGCTGCCCAG GCGCTCACCA ACTCCTACTT CGAGGCGCTG 
GCCATGATCA AGGCCGACCC CGTCAAGTCC AATGAATTGA TGGGCTCGGC CGTCAAGCAG 
ACCGGCGAGC AGTTTGCCAA GTCGGCAGCC TACCTGCGCT GGCAGGACAA GGCGGCCAAC 
CAGAAGTTCT TCGCCGGCGA GATCACCGCG TTCATGAAAG ACGCCGAAAA GATCCTGCTG 
GAGTCCGGCG TGATCCGCAA GGCGCCCGAG AACCTCGCGG CAACGTTTGA CACCAGCTTC 
ATCAAGTAA

Protein sequence

MGKTTVKKLA SLLAAGACAA GMASAAGAQE TKLTLGMSGW TGFAPLSLAD KAGIFKKNGL 
DVEIKFIPQK DRHLALAAGA IQCAATTVET HVAWNANGVP IVQIFQMDKS YGADGLAVRN 
DIKSFADLKG KTIGVDAPGT APYFGLAWML NKNGMTLKDV KTTTLSPQAS AQAFVAGQND 
AAMTYEPYLS TVRDNPASGK ILATTLDYPM VMDTVGCAPT WLKANPKAAQ ALTNSYFEAL 
AMIKADPVKS NELMGSAVKQ TGEQFAKSAA YLRWQDKAAN QKFFAGEITA FMKDAEKILL 
ESGVIRKAPE NLAATFDTSF IK