Gene Sbal195_2728 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sbal195_2728
Symbol
ID	5754501
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella baltica OS195
Kingdom	Bacteria
Replicon accession	NC_009997
Strand	+
Start bp	3234528
End bp	3235688
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	48%
IMG OID	641289036
Product	homogentisate 12-dioxygenase
Protein accession	YP_001555156
Protein GI	160875840
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3508] Homogentisate 1,2-dioxygenase
TIGRFAM ID	[TIGR01015] homogentisate 1,2-dioxygenase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.315515
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.247333
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCATTTT ATGTGAAACA AGGCCAGATC CCCCATAAGC GCCATATCGC ATTTGAAAAG 
GAGAACGGCG AGCTTTACCG TGAAGAGTTG TTCTCAACCC ATGGTTTTTC CAATATTTAT 
TCCAATAAAT ATCACCACAA CATGCCAACC AAAGCGTTGG AAGTGGCTCC TTACAGCCTA 
GGCCACGGTG CCAATTGGGA AGACTCGCTG GTCCAAAACT ATAAACTCGA TTCCCGCGAT 
GCCGACCGTG AAGGTAATTT TTTCAGCGCC CGTAACAAGA TTTTTTATAA CAATGACTTA 
GCACTTTATA CCGCCAAAGT CACCGCCGAT ACCGACGAGT TTTACCGTAA TGCCTATGCC 
GATGAGGTGC TTTTTGTCCA CGAAGGCGAA GGCACACTCT ACAGCGAGTA CGGCACGATT 
AAGGTCCAAA AGTGGGACTA TCTCGTGATC CCACGCGGCA CGACTTATCA ACTTAAATTC 
AACGATTACA GCAATGTGCG ACTTTTCGTT ATCGAGTCAT TCTCTATGGT GGAAGTGCCT 
AAGCATTTCC GTAACGAGTA TGGTCAGCTA TTAGAATCGG CACCTTACTG CGAGCGCGAT 
TTGCGCGTGC CCACATTGCA AGATGCTGTG GTTGAGCGCG GCGCCTTCCC CTTAGTATGT 
AAGTTTGGCG ATAAGTACCA ACTCACCACA CTAGAATGGC ATCCCTTTGA TTTAGTGGGT 
TGGGATGGCT GTGCTTACCC TTGGGCATTC AACATTACTG AATACGCGCC AAAGGTGGGC 
AAAATCCATC TGCCGCCTTC TGATCACTTA GTCTTTACCG CCCATAACTT TGTGATTTGT 
AACTTCGTGC CGCGTCCCTA CGATTTCCAC CCGAAATCGA TTCCGGCGCC TTATTACCAC 
AACAATATCG ATAGCGACGA AGTCTTGTAT TACGTCGATG GCGACTTTAT GAGCCGCACG 
GGCATTGAAG CGGGTTATAT GACCTTACAT CAAAAAGGTG TGGCCCACGG CCCACAACCG 
GGCCGCACTG AAGCCTCGAT TGGCAAGAAA GAAACCTATG AATACGCAGT GATGGTCGAC 
ACCTTCGCCC CACTTAAATT AACCGAACAT GTACAACATT GCATGAGCAA AGACTACAAC 
CGCTCTTGGC TAGAAGACTA G

Protein sequence

MPFYVKQGQI PHKRHIAFEK ENGELYREEL FSTHGFSNIY SNKYHHNMPT KALEVAPYSL 
GHGANWEDSL VQNYKLDSRD ADREGNFFSA RNKIFYNNDL ALYTAKVTAD TDEFYRNAYA 
DEVLFVHEGE GTLYSEYGTI KVQKWDYLVI PRGTTYQLKF NDYSNVRLFV IESFSMVEVP 
KHFRNEYGQL LESAPYCERD LRVPTLQDAV VERGAFPLVC KFGDKYQLTT LEWHPFDLVG 
WDGCAYPWAF NITEYAPKVG KIHLPPSDHL VFTAHNFVIC NFVPRPYDFH PKSIPAPYYH 
NNIDSDEVLY YVDGDFMSRT GIEAGYMTLH QKGVAHGPQP GRTEASIGKK ETYEYAVMVD 
TFAPLKLTEH VQHCMSKDYN RSWLED