Gene Bpro_4031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bpro_4031
Symbol
ID	4013320
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polaromonas sp. JS666
Kingdom	Bacteria
Replicon accession	NC_007948
Strand	-
Start bp	4231334
End bp	4232479
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	63%
IMG OID	637943680
Product	extracellular ligand-binding receptor
Protein accession	YP_550823
Protein GI	91789871
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.2083
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGTGA TCAAAAACGG CGGGCAAGTG CTGAAAGCCC TGGCTCGGGT GTCCATGGTA 
ACGGCCTTGC TGGCTGCCAT GGCCGCCATG GCAACAGGGG CCAGCGCGCA GGATGGCTTG 
AGCAAAACCA CTGTCACGCT GGGGCAGTCG GTGGCCATGA CCGGTCCGGC CGCCGTGCTG 
GCACTGCCGT TTGCGCAGGG TGCCAGGCTT TATTTTGAGC GGGTCAATGC GGCGGGCGGC 
ATCCATGGCC GCGAGATCGA GCTGATTACC GCGGACGACG CCGGCAACCC AGAAACGACC 
CTGGCCAATA CCAAAAAGCT GCTGGACCAG CGGGTTTTTT CGTTGTTTGG CTATTACGGC 
TCACCCCAGG TCACCGCCGT CAATTCTCTG CTCAAGGACA GCGACTTGCT GCTGTTTGGC 
CCCATGGCTG GGGCCGACGA GTTGCGCGGC TCGCTCTATC CCAATGTGTA TTCGGTGCGA 
CCCGGCTACT CGGAAGAGGC GATCGTGATC ACGCGCCATG CGGAAACCCT GGGGATGCGC 
AAGCTGGCCA TATTGCATGC CAGGGATCCC GAATCGCTGG CGGCGCTGGA CTCTGCCGAG 
CGCACCATGA CCGGTATGGG CGCCAACCTG TTGCTCAAGG CACCGCTGGA GGGCACCGAC 
AAAGTGCTGG CGGTCAAAGC GGAGTCCGTG CTTTTGATCA GTGCCCCCAA AGGCGCAGCC 
ATCGCCATCC GCGACTTGCG CAGCAAGGGC TACAAAGGGC CTATTTACGG GTTCTCCAAT 
ACCGGGGAAA GCCTGCTGGC CGATCAGCTG GGGGCAGCGG GCTCGGGCGT GGTGGTGGTG 
CGGGTGACGC CCAAGTCAGA CAATGCCAAA AGCAGCCTGG TGCGTGAGCT GCAGGCCGAG 
GCGGCCGCGG CCAAGCTGGG CAAGTCCAAT GTCTACATGC TCGAAGGCTA TATCGCCGCC 
TGGGCCTACA CCGAAGCCCT GCGCAAGGCC GGCAAGGAGC CCACCCGCGT CAAGCTGCGC 
AAGGCGCTGG ACACCATGCA GGAGATGGAC CTGGGAGGCT TCCGGATCCA TTTCGACGGC 
GACCGTGTGG GCTCCAAGTT GGTGGAACTG AGCCTGATTG ATTCGCAGGG CCGCGTGCGG 
GAGTGA

Protein sequence

MSVIKNGGQV LKALARVSMV TALLAAMAAM ATGASAQDGL SKTTVTLGQS VAMTGPAAVL 
ALPFAQGARL YFERVNAAGG IHGREIELIT ADDAGNPETT LANTKKLLDQ RVFSLFGYYG 
SPQVTAVNSL LKDSDLLLFG PMAGADELRG SLYPNVYSVR PGYSEEAIVI TRHAETLGMR 
KLAILHARDP ESLAALDSAE RTMTGMGANL LLKAPLEGTD KVLAVKAESV LLISAPKGAA 
IAIRDLRSKG YKGPIYGFSN TGESLLADQL GAAGSGVVVV RVTPKSDNAK SSLVRELQAE 
AAAAKLGKSN VYMLEGYIAA WAYTEALRKA GKEPTRVKLR KALDTMQEMD LGGFRIHFDG 
DRVGSKLVEL SLIDSQGRVR E