Gene Bpro_3874 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bpro_3874
Symbol
ID	4013476
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polaromonas sp. JS666
Kingdom	Bacteria
Replicon accession	NC_007948
Strand	+
Start bp	4065449
End bp	4066504
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	63%
IMG OID	637943525
Product	putative hemagglutinin-related protein
Protein accession	YP_550668
Protein GI	91789716
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2706] 3-carboxymuconate cyclase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.978185
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.726778
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTACGCCT ATGTCGGCTC GCGCACCACG CGCGAGCGAA ATGCCCGCGG AGAGGGCATC 
AGCGTCTTCA AGGTTACCCC CGCCACCGGG CAACTGGAAC GGGTGCAAGT GGTCGCGGAC 
CTGGTCAATC CATCCTTCCT GGCCCGCAAT CGCAGAGGTG ATGCGCTCTA TGCGGTGCAC 
GGAGACCGGC AGGAGGTGAG CGCATTCCGG ATAGATCCAG CCGACGGCAC CCTGCACTTT 
CTGAATCGGC AGAGTTGCCA GGGCAACAAC CCTGTCCACC TGGCGCTGGA CCCGACCGAA 
CGTTGCCTGG TCGTGTCCAA CCATTTGAGC GGCAGTCTCG CGGTGCTGCC GGTAGCCGCA 
GATGGTTCGC TGGGTGAGGT GAGCCAGGTC GTCCAGCTGG AAGGCACGCC GGGCCCGCAC 
AAGACCGAGC AGCCTTTTTC AAAGCCGCAC TTCAATCCCT TCGATCCGGG CGGCCGCTTT 
GTTGTCGTAC CCGACAAGGG CCTGGACCGC ATGTTCTGCT TCCGGTTCGC CAACGGCCAG 
CTGCAACCCG CCGCGCGGGC TTCGGTAGCG ACGCGCGAAA ACGCAGGACC GCGCCACCTC 
GCCTTTCATC CGAAAGAGCC CTTCGCCTAT GTGGTGAACG AGCTGGACTC CAGCGTGACC 
GCTTATCGTT TCAGCGCAGA AACGGGTGAT CTGGAACCCA TGCAGGTTCT GTCTGCCCTG 
CCCGATCATT TCACCGGCAA CAGCCGCGCC TCGGGCATCG TCGTGGACCA TGCGGGGCGC 
ACGCTTTACG CCTCCAACCG GGGCTATGAC AGCATTGCGA TCTTCCGGAT TGAGCCGGGC 
ACGGGGCGCC TGGCATTCAT GGGTACCCAG GCGTCAGAGG GACGGACACC CCGGTTTTTC 
ACGTTAAGCC CCGACGGACG CATCCTCTTC GTACTCAACG AAGACAGCGA CAGCATTGTG 
CCCTTCACCG TGCACGAGAG CTCCGGCCCG CTGAGGTCCA CGGGGCTGTC GGTGCCCTGC 
GGCAGCCCGG TCTGCATGGT GTTTTCACCG TCATAA

Protein sequence

MYAYVGSRTT RERNARGEGI SVFKVTPATG QLERVQVVAD LVNPSFLARN RRGDALYAVH 
GDRQEVSAFR IDPADGTLHF LNRQSCQGNN PVHLALDPTE RCLVVSNHLS GSLAVLPVAA 
DGSLGEVSQV VQLEGTPGPH KTEQPFSKPH FNPFDPGGRF VVVPDKGLDR MFCFRFANGQ 
LQPAARASVA TRENAGPRHL AFHPKEPFAY VVNELDSSVT AYRFSAETGD LEPMQVLSAL 
PDHFTGNSRA SGIVVDHAGR TLYASNRGYD SIAIFRIEPG TGRLAFMGTQ ASEGRTPRFF 
TLSPDGRILF VLNEDSDSIV PFTVHESSGP LRSTGLSVPC GSPVCMVFSP S