Gene Bpro_1194 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bpro_1194
Symbol
ID	4012163
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polaromonas sp. JS666
Kingdom	Bacteria
Replicon accession	NC_007948
Strand	-
Start bp	1234800
End bp	1236335
Gene Length	1536 bp
Protein Length	511 aa
Translation table	11
GC content	70%
IMG OID	637940871
Product	thymidine phosphorylase
Protein accession	YP_548043
Protein GI	91787091
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0213] Thymidine phosphorylase
TIGRFAM ID	[TIGR02645] putative thymidine phosphorylase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAACCC CGCCGACTCC GCTTTCTTCA CTCACTCCGC ACAAGCTGCG CCTGCGGCGG 
CTGGGCATAG ACACCTACCA GGAGCCGGTG CTCTACATGC ATCGCGACTG CCGCGTCTGC 
CACTCGGAAG GCTTCGAGGC GCAATCCCGG GTGGAGCTCG CGCTGGGCGA CCGCACCATT 
GTCGCCACGC TGAATGTGGT GTCTGGTGAC TTTCTGGCCC CCGACGAGGC CGGCCTGTCC 
GAGGCGGCGT GGCGTCTGCT CGGGGCGCAA GAAGGTGACA TGGTCTCGCC GCGCCACCCC 
GCACCGATCG AATCACTGGG TCATGTGCGT GCCAAAGTCT ATGGACGGCA CCTCACCCAG 
GCCGCCATCA CGGCCGTGAT TGAAGACGTG ACCGCGGGTC GCTACTCGGA CCTGCAGCTG 
GCGGCCTTTG TCACAGCCTG TGCCGGCGAC CGGCTGGACC AGGAAGAGAC CGTCTCGCTC 
ACCCGCGCGA TGGTCGCCGC CGGCGAGCGG ATTGACTGGG GTGAGGGCCT GGTCATGGAC 
AAACACTGCG TGGGCGGGCT GCCGGGCAAC CGAACGACCA TGGTGATCGT GCCCATCGTG 
GCGGCCTGCG GACTGCGCAT GCCCAAAACC TCGTCGCGCG CCATCACCTC CCCCGCCGGT 
ACGGCCGACA CCATGGAGAC ACTGGCGCCG GTGGACCTGG ATGTGGCGCA GATCCGCCGG 
GTGGTGGAAC GCACCGGCGG CTGCGTGGTG TGGGGCGGCG CGGTACGCCT GAGCCCGGCG 
GACGACATCC TGATCCGGGT GGAACGCCCG CTGGACCTGG ACAGCCAGGG CCAGCTGGTG 
GCGTCGATTT TGTCCAAGAA GGTGGCGGCG GGTTCCACCC ACGTGCTGAT CGACATGCCC 
GTGGGGCCCA CCGCCAAGGT TCGCAGCGCC GAGGCGGCGG ATTTGCTGGG CCGGCTGCTC 
GGCCAGGTGG GGCAGACCCT CGGACTGCGG ATGCGCGTGG TGCAGACTGA CGGCCTGGCC 
CCGGTGGGCC GCGGCATAGG CCCCGCGCTG GAGGCGCGCG ACGTGCTGGC CGTGTTACGC 
AACCTGGCCA CCGCGCCGGC CGACCTGGCC CAGCGCTCGC TGCTGTTGGC CGGTGAAGTG 
CTCGAGTTCG GTGGTGCCGC GCCGGCCGGT GGCGGGCTGG CGCTGGCCAG CGCCGTGCTG 
GCCGACGGGC GTGCCTGGCG CAAGTTCCAG GACATCTGTG CGGCTCAGGG TGGCCTGCGC 
GAGCCGCCCG TAGCCGCGCA CCAGCAGGCG GTGCATGCCC TGCGCAGCGG CAGCGTTCTC 
GCCATCGACA ACCGGCGCCT GGCCCGCATT GCCAAACTGG CCGGTGCCCC CGGGGCGGCT 
TGCGCGGGCA TCGACCTGCA TGTTCGGCCG GGTGAGTTCG TCGAGCGCGG CCAGCCGCTG 
TTCACGCTGC ACGCAGCCAC GCCGGGTGAG CTGGCCTATG CATTGGAATA CGCGGCCTCG 
CAGGCTGAGA CCGTGCATGT GCTGGAGGAT GCCTGA

Protein sequence

MQTPPTPLSS LTPHKLRLRR LGIDTYQEPV LYMHRDCRVC HSEGFEAQSR VELALGDRTI 
VATLNVVSGD FLAPDEAGLS EAAWRLLGAQ EGDMVSPRHP APIESLGHVR AKVYGRHLTQ 
AAITAVIEDV TAGRYSDLQL AAFVTACAGD RLDQEETVSL TRAMVAAGER IDWGEGLVMD 
KHCVGGLPGN RTTMVIVPIV AACGLRMPKT SSRAITSPAG TADTMETLAP VDLDVAQIRR 
VVERTGGCVV WGGAVRLSPA DDILIRVERP LDLDSQGQLV ASILSKKVAA GSTHVLIDMP 
VGPTAKVRSA EAADLLGRLL GQVGQTLGLR MRVVQTDGLA PVGRGIGPAL EARDVLAVLR 
NLATAPADLA QRSLLLAGEV LEFGGAAPAG GGLALASAVL ADGRAWRKFQ DICAAQGGLR 
EPPVAAHQQA VHALRSGSVL AIDNRRLARI AKLAGAPGAA CAGIDLHVRP GEFVERGQPL 
FTLHAATPGE LAYALEYAAS QAETVHVLED A