Gene Spro_2096 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Spro_2096
Symbol
ID	5606473
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Serratia proteamaculans 568
Kingdom	Bacteria
Replicon accession	NC_009832
Strand	-
Start bp	2290413
End bp	2291675
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	60%
IMG OID	640937634
Product	protocatechuate 4,5-dioxygenase
Protein accession	YP_001478327
Protein GI	157370338
COG category	[S] Function unknown
COG ID	[COG3384] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.624399
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTAAGA TCATTGGCGG ATTGGCGGTG TCACACACCC CAACCATCGG TTTTGCAGTG 
GATCACAACA AGCAGAACGA AACGGCCTGG GCGCCCATTT TTGACGGTTT CGCCCCGATG 
CAGCAATGGC TGGAAGAGAA AAAGCCGGAC GTGTTGCTGT ATGTCTTCAA CGACCACGTG 
ACCTCGTTTT TCTTCGATCA CTATTCGGCA TTCGTGCTCG GCATTGACGA CAGCTACGCG 
GTGGCGGACG AAGGTGGCGG CCCGCGTGAT TTGCCGCCGA TTCGCGGCCA TGCGGCGCTG 
TCACAGCACA TCGGTGCCAG CCTGATGGCC GACGAGTTTG ATATGTCGTT CTTCCAGGAT 
AAGCCGCTCG ATCACGGGCT GTTCTCTCCG CTCTCCGCCC TGCTGCCGTG GCAGAATGGC 
TGGCCGATGC AGGTGGTGCC GCTGCAGGTC GGGGTGCTGC AGTTCCCGAT CCCTTCGGCT 
CGCCGCTGCT ACAAGCTCGG TCAGGCGCTG CGCCGGGCAA TTGAAAGCTT CCCGGAAGAC 
TTGCGCGTCG CGGTGGTGGC CACCGGCGGC GTCTCGCATC AGGTGCATGG CGAACGTTGC 
GGTTTTAATA ATCCGCAGTG GGATGAGCAG TTTGTCGACC TGCTGGTCAA TGACCCGGAG 
CGCCTGACCG AAATCACGCT GGCGGAGTAC GCCACCTTGG GTGGGCTGGA GGGCGCGGAG 
GTGATCATGT GGCTGATTAT GCGCGGCGCC CTGTCGGCCA ACGTCGAAAA ACTGCATCAG 
GCCTATTACC TGCCGTCCAT GACCGGTATC GCCACGCTGA TCCTGGAAAA CCAGGCGCGC 
GAGGCACCGG TAGATGTCCA TCAGCGCCAG CGCGACAAAA TCAACCTGCA ACTGGCGGGG 
GTTGAGAAAC TGCCGGGCAC CTATCCCTTT ACCCATGCGC GCAGCCTGAA AGCCATCCGC 
ATCAACCGTT TCCTGCACAA ACTGATCCAG CCGGCCTGGC GCGAACGCTT CAATAACGCC 
CAGCAGGCGC TGTTCGACGA AGCGCAGCTC ACCACTGAGG AACAGCAGCT GCTGCGCGAG 
CTGGACTGGC GCGGGCTGAT CCATTACGGC GTCAGTTTCT TCCTGTTGGA AAAGCTCGGG 
GCAGTGGTCG GGGTATCCAA CCTGCATATC TACTCGGCGA TGCGTGGCCA GACGCTGGAT 
GAGTTCCAGC AAACCCGCAA TCAGCAAGTG TTGTATTCCG TTGCGGGGAA AGCGCCAAAA 
TGA

Protein sequence

MAKIIGGLAV SHTPTIGFAV DHNKQNETAW APIFDGFAPM QQWLEEKKPD VLLYVFNDHV 
TSFFFDHYSA FVLGIDDSYA VADEGGGPRD LPPIRGHAAL SQHIGASLMA DEFDMSFFQD 
KPLDHGLFSP LSALLPWQNG WPMQVVPLQV GVLQFPIPSA RRCYKLGQAL RRAIESFPED 
LRVAVVATGG VSHQVHGERC GFNNPQWDEQ FVDLLVNDPE RLTEITLAEY ATLGGLEGAE 
VIMWLIMRGA LSANVEKLHQ AYYLPSMTGI ATLILENQAR EAPVDVHQRQ RDKINLQLAG 
VEKLPGTYPF THARSLKAIR INRFLHKLIQ PAWRERFNNA QQALFDEAQL TTEEQQLLRE 
LDWRGLIHYG VSFFLLEKLG AVVGVSNLHI YSAMRGQTLD EFQQTRNQQV LYSVAGKAPK