Gene CA2559_02385 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CA2559_02385
Symbol
ID	9295962
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Croceibacter atlanticus HTCC2559
Kingdom	Bacteria
Replicon accession	NC_014230
Strand	-
Start bp	564692
End bp	566851
Gene Length	2160 bp
Protein Length	719 aa
Translation table	11
GC content	36%
IMG OID
Product	Prolyl endopeptidase
Protein accession	YP_003715243
Protein GI	298207064
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACAAC TCATCCTTGT AACAATAACT GCAGCAACAA TATTTAGCTG TAAAACAGAG 
ACTAAAACCG ATAGAACCAT AGCAGTGACA TACCCCGAAA CAAAGAAAGT AGATACCGTA 
GATGTATATT TTGGTAATGA GGTGAAAGAC CCATATCGCT GGTTAGAAGA TGATCGCAGT 
AAAGAAACCG AAGATTGGGT GAAAGCTCAA AACCAAGCTA CATTTGGATA TTTAGACAAA 
ATTCCTTTTA GAGAAGATCT TAAAAACAGA TTAACCGAAC TGTGGAATTA TGAAAAGTTG 
GGATCACCCT TTAAAGAAGG TGAGTATACC TACTATTTTA AAAACAATGG GTTGCAAAAC 
CAAAGTGTGA TTTATAGGTA TAAATCTACC GAAAGCCCTG AAAATGCTAA AGTATTCCTG 
GATCCAAATA AGTTTAGTGA AGACGGTACA ACATCATTAG GAGGATTAAA CTTTTCTAAA 
GATGGAAGTA AAGCAGCTTA TTCAATTTCT GAAGGCGGTA GTGATTGGAG AAAAGTAATT 
GTTGTAGATG CAGAAACCTT GGAACGTGTT GAAGATACTT TACAGGATAT TAAATTTAGT 
GGTGTGTCTT GGAACGTGAA TGAAGGATTT TATTATTCAA GTTATGACAA ACCTAAAGGC 
AGTGAGTTGT CTGCAAAAAC AGACCAGCAT AAACTATATT ATCACAAGCT AGGAACCTCT 
CAAAAAGAGG ATAAACTTAT TTTTGGAGGA ACACAAGAAG AAAAAAGAAG ATATGTTGGT 
GGCAGTGTAA CAGAAGATGG TAAGTATTTA ATTGTTTCAG GAAGTGTATC AACCTCAGGA 
AACGATTTAA GAATAAAAGA CCTTACCAAG CCAAATTCAG ATTTTAAAAC TATAATTTCT 
GGCTACGAAA CAGATTCATA CGTTATAGAA AATGAAGGCA GTAAACTATA TATTGTAACA 
AACCTAAATG CACCTAATAA AAAAATTGTG ACGGTTGATG CTGAAAACCC ATCACCAGAA 
AATTGGGTAG ATTTCATTCC AGAAACAGAA CATGTGCTTA GTCCTAGTAA AGCTGGTGGC 
TACTTCTTTG CAGAATATAT GGTAGATGCT GTAAGCGAAG TAAAACAATA CGATTATGCT 
GGTAAATTAA TACGTGAAGT TAAACTTCCA GGAGTTGGAA CAGTTGGTGG CTTTGGTGCT 
AAAAAAGAAG ATAAAGAACT GTATTTCTCT TTTACAAATT ATGTAACACC AGGCAGCATA 
TATAAGTATG ATATTGAAGA TGGTAATTCA GAGCTATATG TAAAACCAGA AATAGATTTT 
AATCCAGACC ATTATAAGAG TGAACAGGTG TTCTTTAACT CTAAAGATGG TACAAAAATA 
CCCATGATTA TAACCTATAA AAAAGGGACA GAGCTTAATG GTAAGAACCC TACGATACTA 
TATGGTTATG GAGGTTTCAA TATAAGTTTA ACACCAAGTT TTAGTATAGC AAACGCTGTG 
TGGATGGAGC AAGGTGGAAT TTATGCAGTT CCTAATTTGC GCGGTGGTGG AGAATACGGT 
AAAGCTTGGC ATGATGCTGG TACTAAACTA CAAAAGCAAA ATGTATTTAA TGACTTTATA 
GCTGCGGCAG AATATTTAAT TGAGAAGAAC TACACATCAA AAGAATATTT GGCAATTAGA 
GGCGGTTCAA ATGGTGGATT ATTAGTCGGA GCCACGATGA CACAACGACC AGATTTAATG 
CAAGTAGCAT TGCCTGCAGT AGGCGTGATG GATATGTTAC GCTATCATAC CTTTACAGCA 
GGTGCAGGTT GGGCATATGA TTATGGAACG GCAGAAGATT CCGATGAAAT GTTTCAATAC 
CTAAAAGGAT ACTCGCCAGT ACACAATGTA AAAGAAGGTG TTTCTTATCC TGCTACAATG 
GTAACTACTG GAGATCATGA TGATCGCGTA GTACCAGCGC ATAGTTTTAA GTATGCTGCA 
GAGTTGCAAG ATAAACAAGC TGGAAATGCT CCTACATTAA TTAGAATTGA AACTAATGCT 
GGCCATGGTG CAGGAACACC AGTAAGTAAA ACTATAGAGC AGTACGCAGA TATTTTTGGT 
TTTACGCTTT ACAATATGGG TTATGATGAG TTGCCGGTAA AGAAACAATT TAAAGACTAA

Protein sequence

MKQLILVTIT AATIFSCKTE TKTDRTIAVT YPETKKVDTV DVYFGNEVKD PYRWLEDDRS 
KETEDWVKAQ NQATFGYLDK IPFREDLKNR LTELWNYEKL GSPFKEGEYT YYFKNNGLQN 
QSVIYRYKST ESPENAKVFL DPNKFSEDGT TSLGGLNFSK DGSKAAYSIS EGGSDWRKVI 
VVDAETLERV EDTLQDIKFS GVSWNVNEGF YYSSYDKPKG SELSAKTDQH KLYYHKLGTS 
QKEDKLIFGG TQEEKRRYVG GSVTEDGKYL IVSGSVSTSG NDLRIKDLTK PNSDFKTIIS 
GYETDSYVIE NEGSKLYIVT NLNAPNKKIV TVDAENPSPE NWVDFIPETE HVLSPSKAGG 
YFFAEYMVDA VSEVKQYDYA GKLIREVKLP GVGTVGGFGA KKEDKELYFS FTNYVTPGSI 
YKYDIEDGNS ELYVKPEIDF NPDHYKSEQV FFNSKDGTKI PMIITYKKGT ELNGKNPTIL 
YGYGGFNISL TPSFSIANAV WMEQGGIYAV PNLRGGGEYG KAWHDAGTKL QKQNVFNDFI 
AAAEYLIEKN YTSKEYLAIR GGSNGGLLVG ATMTQRPDLM QVALPAVGVM DMLRYHTFTA 
GAGWAYDYGT AEDSDEMFQY LKGYSPVHNV KEGVSYPATM VTTGDHDDRV VPAHSFKYAA 
ELQDKQAGNA PTLIRIETNA GHGAGTPVSK TIEQYADIFG FTLYNMGYDE LPVKKQFKD