Gene CA2559_11333 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CA2559_11333
Symbol
ID	9297754
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Croceibacter atlanticus HTCC2559
Kingdom	Bacteria
Replicon accession	NC_014230
Strand	+
Start bp	2463309
End bp	2464628
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	34%
IMG OID
Product	dipeptidase
Protein accession	YP_003717008
Protein GI	298208829
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAAATG TCCTTTCACT AGTATTATTA GTCTTTATTT CAATAAGTTG TAAAGATATT 
GAACCTAAAG AACTAACCGA AAATCAACTG CTTGCAAAGG CCATGTCTAT TCATTTAGAA 
GTTATCACTT TAGATACACA TTGTGATATA AATATTCGAA ATTTCACTGA CTCTATTAAC 
TATACACAAA ATCTAGAAAC ACAAGTTAAT CTTCCTAATA TGAAAGAAGG TGGTTTAGAT 
GTGGCTTGGT TTATTGTGTA TACAGGACAA GACTCTTTAA ATGACATAGG TTATAAAAAC 
GCATACGATA ATGCTATTAG AAAATTTGAA GCTATACATA GGTTAGTAGA CAGTATTGCT 
CCTAATGATA TTGCTTTAGC AACAACCTCT AAAGAAGTAA AAGATATACA CGAATCAGGC 
AAACTTGTTG CGATGATAGG TATAGAAAAC GGTTACCCAA TAGGTACAGA TCTTAGTAAC 
GTCAAGACAT TTTACGATAT GGGTGCACGC TATATGTCTT TATCACATAA TGGGCACAGC 
CAATTATCAG ACTCTAACAC TGGAGAAAAA GATGGTGTCT GGTTACATAA TGGGTTAAGT 
GAATTAGGAA AAGAAGTGGT TTCTGAAATG AATCGTGTTG GTATGATGAT AGATGTATCT 
CATCCATCTA AAGAAGCCAT GCGACAAATG ATAAATTTAA CCGAAGCGCC AATAATAGCT 
TCACACTCAT CTGCCAGAGC GCTTTGCGAT CATAGTAGAA ATTTAGATGA TGAGCAGTTA 
CAATGGTTAA AAGAAAACAA TGGTGTTGTA CAAACTGTAG CATTCAGCAG TTATTTAAAT 
ACCGAAAAGC ACAATGCATT TAATGACGCT AAGCAAAAGT TATACAAATC AGTTGGACAA 
AAGATGGGTT TTGAAATCAT TGAGCGTGAT AGCGTAAGAC TTTTAGACAA TGAAGCAAGA 
ACGGCATATT ATGATAATTA TAGAAAAGTT ATAAATGCTT CGAAAGAGAA GGTTGAAGCC 
TTAAAGCAGG AAGTAGCACC TGTAAATGTT TCAGATTTTG CAGATCATAT AGATTATCTC 
GTTGAAAAAA TTGGAATTTC TCACGTAGGC ATTAGTTCAG ATTTTGATGG TGGTGGCGGT 
ATTCACGGTT GGGAAGATGC TTCAGAAACC TTTAATGTAA CATTAGAGTT AGTTAGGCGT 
GGTTATACTC AAAAAGAAAT TGAAATGCTT TGGTCTGGAA ACTTATTAAG AGTTTTAGAT 
GACGTTGAAG CGGTTTCGAA ACGAATTCAA GAAATTGAAA CTGAGGTTGC AAATAATTAA

Protein sequence

MRNVLSLVLL VFISISCKDI EPKELTENQL LAKAMSIHLE VITLDTHCDI NIRNFTDSIN 
YTQNLETQVN LPNMKEGGLD VAWFIVYTGQ DSLNDIGYKN AYDNAIRKFE AIHRLVDSIA 
PNDIALATTS KEVKDIHESG KLVAMIGIEN GYPIGTDLSN VKTFYDMGAR YMSLSHNGHS 
QLSDSNTGEK DGVWLHNGLS ELGKEVVSEM NRVGMMIDVS HPSKEAMRQM INLTEAPIIA 
SHSSARALCD HSRNLDDEQL QWLKENNGVV QTVAFSSYLN TEKHNAFNDA KQKLYKSVGQ 
KMGFEIIERD SVRLLDNEAR TAYYDNYRKV INASKEKVEA LKQEVAPVNV SDFADHIDYL 
VEKIGISHVG ISSDFDGGGG IHGWEDASET FNVTLELVRR GYTQKEIEML WSGNLLRVLD 
DVEAVSKRIQ EIETEVANN