Gene Bpro_1744 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bpro_1744
Symbol
ID	4015607
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polaromonas sp. JS666
Kingdom	Bacteria
Replicon accession	NC_007948
Strand	-
Start bp	1803782
End bp	1804912
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	60%
IMG OID	637941416
Product	Rieske (2Fe-2S) region
Protein accession	YP_548578
Protein GI	91787626
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.517961
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGATC TAAGCCTTCG CCTGCTGCAG GCCACCAGCC AGCTTCCCAT CTCCAGCTAC 
TTTGATACCG GCCTGTACCA GCGGGAGCAG CAAAAACTGT TTGCCCGCGG GCCGCGCTAC 
CTGGGCCATG AGCTCGCGGT GCCCAACCTC GGCGACTTTT ATGCGCTGCC ACACGAAGGT 
GAAGGCCGCG CGCTGGTGCG CAACAGGTCG GGCATTGAAC TGATTTCCAA TGTCTGCAGA 
CATCGCCAGT CGACCATGCT GCAGGGCCGC GGCTCTTTGG GCAACGGGGC TGACAGCAAT 
ATCGTGTGCC CGCTGCACCG CTGGACTTAC AACACCTCGG GCGAGCTGAT CGGTGCGCCG 
CACTTTGAGA TTGACCCCTG CCTGAACCTC AACCGCTACA AAACGACCAC CTGGAACGGC 
CTGGTATTCG AAGACAACGG CCGCGATATC GCCGGCGAGA TGTCGCAACT GGCCACCCGG 
GCCGACCTGG ATTTTGTCGG CTACCAGCTG GACAAGGTCC ACCTGCACGA ATGCAACTAC 
AACTGGAAGA CCTTTATTGA GGTCTACCTT GAGGACTACC ACGTGGGGCC TTTCCATCCC 
GGGCTGGGCG GATTTGTCAC CACGGAAGAT CTGCGCTGGG AACTGAAACC CAATTACTCG 
GTGCAAACCG TGGGCGTGTC CGACAAACTG GGCAAGCCCG GCACAGACAT CTACAAAAAA 
TGGCATGACG TGGTGCTGCA ATACCGCCAG GGCGTAGCCC CCAAATACGG CGCGATCTGG 
CTCACCTACT ATCCGCATGT GATGGTCGAG TGGTACCCGC ATGCCCTGGT GGTCAGCACG 
CTGCACCCGC AGGGGCCGGA CAAGACACTC AACGTGGTTG AATTTTTCTA CCCCGAGGAA 
ATCTGCGCCT TCGAGCGCGA GTTCATCGAA GCGCAGCAGG CCGCCTACAT GGAAACCTGC 
GTGGAGGACG ACGAAATCGC ACTGCGCATG GACGCCGGCC GCAAGGCGCT GATGCAGCGC 
GGCGACAACG AGTTCGGCCC CTACCAGAGC CCCATGGAAG ACGGCATGCA GCACTTTCAC 
GAGTGGTACC GCCGCGAAAT GGGCGCCAGC AAAACCACGC AGATGATCTG A

Protein sequence

MSDLSLRLLQ ATSQLPISSY FDTGLYQREQ QKLFARGPRY LGHELAVPNL GDFYALPHEG 
EGRALVRNRS GIELISNVCR HRQSTMLQGR GSLGNGADSN IVCPLHRWTY NTSGELIGAP 
HFEIDPCLNL NRYKTTTWNG LVFEDNGRDI AGEMSQLATR ADLDFVGYQL DKVHLHECNY 
NWKTFIEVYL EDYHVGPFHP GLGGFVTTED LRWELKPNYS VQTVGVSDKL GKPGTDIYKK 
WHDVVLQYRQ GVAPKYGAIW LTYYPHVMVE WYPHALVVST LHPQGPDKTL NVVEFFYPEE 
ICAFEREFIE AQQAAYMETC VEDDEIALRM DAGRKALMQR GDNEFGPYQS PMEDGMQHFH 
EWYRREMGAS KTTQMI