Gene Bpro_4335 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bpro_4335
Symbol
ID	4012984
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polaromonas sp. JS666
Kingdom	Bacteria
Replicon accession	NC_007948
Strand	-
Start bp	4572241
End bp	4573821
Gene Length	1581 bp
Protein Length	526 aa
Translation table	11
GC content	58%
IMG OID	637943985
Product	extracellular solute-binding protein
Protein accession	YP_551122
Protein GI	91790170
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.83307
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGGCGG TCGACTATGT GATCGCGTGT CGAGCGCTCC TCATCGCCGC ATGTATTGGC 
CTTGTCGGGC CGGTATTTGC TCAGGAGTCC ATCCTCCGCA TCGGAAGTGA TGCGATTGAC 
ATCACTACTC TGGATCCGCA CCGCACGGCG GTGTCGGAAG AAAAGGGCTT GATTAGCATG 
ATCTTCGGTG GCTTGGTGAG ATTTCCACCC GGTTCCGCTG ACCCCGAGAA AATAGAAGGT 
GATTTGGCCG AGAGCTGGCA GGCTTCTGCT GATGGACTGA CCTGGACATT CAAGCTGCGT 
CACGGTGTGC AGTTCCACCG CAACTATGGC GAGGTGAATG CGGAGGATGT GGTTTATAGC 
CTAATGCGCG CAGCCGATCC AAAGCGGTCC TCGTTTTCGT CTACCTTTGA GCCGGTGAAG 
GAAGTGAGCG CGCTCGATTC GCATACGGTG CGCATACAGC TCAAGGCGCC AGTACCCAGT 
CTGCTGGGAC TGGTTGCCAA CTACCACGGC GGAATGGTCG TAAGCCGCAA GGCCGACCAG 
GATCTGAAAG ACGCGTTCAA ATTGAAGCCA GTTGGCTTTG GGCCCTTCGA GTTCGTTGAA 
CATCAGAAAC AGCGCGAGGT GGTGCTGAAG GCGCACGACA AGTATTTCCG TGGGAAGCCG 
AAGATAGAGC GCATCGTTTA CCGATTCATC CCCTCCGAGG CCGTCCGGGG GCTAGCGTTC 
GCTACTGGCG AGCTTGACCT GGTCGCCGGC CAGCGCGATC AGCGCTGGGT GCAGCGGGCC 
CGGCTCTGGG CGCCGCCTAA GGACCAATCG TCCGTCAAAG TCGATGTCTT CGGACCAGGT 
GAATTTCGTA CCCTGATGCT CAATCGGCGC ATCAAGCCGC TGGACGACCC GCGTGTTCGG 
GAAGCCGTAG CACGCGCCGT GGATGTGCAG GAACTAGTTC ACTTCGTCGG CGCGGATATC 
GTCAAGCCTG GCAGATCTGT CATTCCGCCA GGCTACGCAG GTGAGGTAGA CGTTGGGCCA 
AAGTTTCCTT ATAACGTCGG CAAGTCAAAA GCTTTGCTGA CGGAAGCCGG CTACGCCAAC 
GGCATCACCC TAAGGGCGGT AGTGTCCAGT ACCGCCTCGC AACTGTCGGT TATGGATGTG 
GTGCAGAAAC AGCTCAAGCG CGCGGGCATC AACTTAACCA TGGACGTGGT CGAGCACGCC 
GCTTATCACG CGCAGATCCG CAAGGACGTG AGTGCAATCG TCTTCTACGG CGCTGCTCGA 
TTCCCGGTGG CCGATTCCTA CCTCACAGAG TTCTATCACT CCCGCTCCGA GATCGGCGCA 
CCTACTCAGG TTACCAATTT CTCCCACTGC AATGCAGCCG ACAAGGAAAT TGATGCGGCG 
CGCGCAACCC CAAATGCGGC TGCGCGAAGC TCGCTTTGGC GCGTGGCACA GGTGAAGATC 
AACGCAGATC TCTGCGCCAT CCCGCTATTT GATCTGCAGC AGGTCTGGGC CCGTCGCGGT 
GCGCTCGACT ATGGAGTGCC TCTTGAGGGC GCAATGAACC TCTTTCCGCC GATCAACGAA 
AAATCGACAC TGAAGAAATG A

Protein sequence

MKAVDYVIAC RALLIAACIG LVGPVFAQES ILRIGSDAID ITTLDPHRTA VSEEKGLISM 
IFGGLVRFPP GSADPEKIEG DLAESWQASA DGLTWTFKLR HGVQFHRNYG EVNAEDVVYS 
LMRAADPKRS SFSSTFEPVK EVSALDSHTV RIQLKAPVPS LLGLVANYHG GMVVSRKADQ 
DLKDAFKLKP VGFGPFEFVE HQKQREVVLK AHDKYFRGKP KIERIVYRFI PSEAVRGLAF 
ATGELDLVAG QRDQRWVQRA RLWAPPKDQS SVKVDVFGPG EFRTLMLNRR IKPLDDPRVR 
EAVARAVDVQ ELVHFVGADI VKPGRSVIPP GYAGEVDVGP KFPYNVGKSK ALLTEAGYAN 
GITLRAVVSS TASQLSVMDV VQKQLKRAGI NLTMDVVEHA AYHAQIRKDV SAIVFYGAAR 
FPVADSYLTE FYHSRSEIGA PTQVTNFSHC NAADKEIDAA RATPNAAARS SLWRVAQVKI 
NADLCAIPLF DLQQVWARRG ALDYGVPLEG AMNLFPPINE KSTLKK