Gene CA2559_02595 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CA2559_02595
Symbol
ID	9296004
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Croceibacter atlanticus HTCC2559
Kingdom	Bacteria
Replicon accession	NC_014230
Strand	+
Start bp	612232
End bp	613392
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	36%
IMG OID
Product	homogentisate 1,2-dioxygenase
Protein accession	YP_003715285
Protein GI	298207106
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTTTTT ACCATAAACT CGGTAAGATT CCTCATAAGC GTCATACCAT TTTTAAGAAA 
CCAGATGGCT CATTATACTA TGAGCAGCTT TTTGGCACAA TTGGTTTTGA TGGTATGAGC 
AGTAACTTAT ACCACGAACA TAGACCTACA CAGGTTAAAA AAATAGACGG CAGTTATGAT 
GTAACTCCTA AAGTAGCTAC CAAAAACAAT ATGCATTCTT TACGCCTTAA GGGTTTTCAG 
GTTATACCAG AACCAGATTA CTTAGAAAGC AGAAAGGTAG TGCTTACAAA TAGCGATGTA 
GATATTACAT TAGCATCGCC TCAAAATTTA ACACAAGACT ATTTTTATAA AAATGCAGAT 
AGTGATGAGT TATTATTTGT ACATAAAGGT AGCGGTGTCT TAAGAACGCA TTTAGGTAAT 
TTAGATTTTA AATATGGAGA TTACCTTTTA ATACCTAGAG GTGTTATTTA TAAAATAGAT 
TTTGATGATG AAAACAATAG ACTATTTATA GTTGAGTCAC GTCGTCCTAT ATACACTCCT 
AAACGTTACA GAAATTGGTT TGGACAATTG TTAGAGCATT CTCCATTTTG TGAGCGTGAC 
CTAAGACAAC CTCAAGACTT AGAAACTCAT GATGAGGTTG GAGATTTTGT AATTAAAGTA 
AAAAAGAATA ACGAAATCTT CAATATGGTT TATGCCACGC ATCCTTTTGA TGTTGTTGGG 
TATGATGGCT ATAATTATCC ATATGCATTT TCAATACATG ATTTTGAACC TATAACTGGT 
CGCATACACC AACCGCCACC AGTACACCAA ACATTTGAGA CAGATGCCTT TGTAGTATGT 
AGTTTTTGTC CGAGAAAATA CGATTACCAT CCAGAAAGCA TTCCTGCACC TTACAACCAT 
AGCAATATAG ATAGTGATGA AGTGCTGTAT TATGTAGATG GTGATTTTAT GAGCAGAAAT 
GATATTGAGC CAGGACACAT ATCACTGCAT CCTGCCGGCA TACCTCACGG CCCACATCCA 
GGTGCTGTAG AACGTAGCAT AGGGCAGACA GAAACTGAAG AGCTTGCTGT TATGGTAGAT 
ACTTTTAAAC CATTAATGGT AACTGAAGAA GGTGCTAAAA TAGCAGATAA ATCTTACCAC 
CAATCTTGGT TAGAACACTA A

Protein sequence

MPFYHKLGKI PHKRHTIFKK PDGSLYYEQL FGTIGFDGMS SNLYHEHRPT QVKKIDGSYD 
VTPKVATKNN MHSLRLKGFQ VIPEPDYLES RKVVLTNSDV DITLASPQNL TQDYFYKNAD 
SDELLFVHKG SGVLRTHLGN LDFKYGDYLL IPRGVIYKID FDDENNRLFI VESRRPIYTP 
KRYRNWFGQL LEHSPFCERD LRQPQDLETH DEVGDFVIKV KKNNEIFNMV YATHPFDVVG 
YDGYNYPYAF SIHDFEPITG RIHQPPPVHQ TFETDAFVVC SFCPRKYDYH PESIPAPYNH 
SNIDSDEVLY YVDGDFMSRN DIEPGHISLH PAGIPHGPHP GAVERSIGQT ETEELAVMVD 
TFKPLMVTEE GAKIADKSYH QSWLEH