Gene CA2559_06520 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CA2559_06520
Symbol
ID	9296799
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Croceibacter atlanticus HTCC2559
Kingdom	Bacteria
Replicon accession	NC_014230
Strand	-
Start bp	1452629
End bp	1453729
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	35%
IMG OID
Product	N-acetylglucosaminyl transferase
Protein accession	YP_003716063
Protein GI	298207884
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAACT TAAAATTCAT ATTATCAGGT GGCGGAACTG GAGGACATAT ATATCCTGCA 
ATAGCAATTG CCAATGAATT GAAAAATCGT TACCCAGATG CAGAGTTTCT ATTTGTAGGA 
GCTAAAGACC GCATGGAAAT GGAAAAAGTT CCAAACGCTG GTTACAATAT CAAGGGACTT 
TGGATAAGTG GTATACAACG TAAACTCACC TTCACAAATC TTATGTTTCC ATTCAAACTA 
TTGTCTAGTT TATGGAAAAG TAGAAGCATT ATAAAAAGAT TTAAACCTGA CGTGGTAATT 
GGTACAGGAG GTTTTGCGAG TGGGCCATTG CTTAAAATGG CAAATAGCAA GAACATTCCT 
ACCCTTATAC AAGAACAAAA TAGTTACGCA GGTATTACCA ATAAATGGTT AGCAGATAAG 
GCTAACAAAA TATGTGTGGC TTATGACCAT ATGGAAAAGT ATTTTCCAGC AGAAAAAATT 
ATAAAAACTG GCAATCCTGT TAGGCAAGAC ATTAAAGATC TTGATTCAAA AAGAGCAGAA 
GGCATAGATC ATTTTGAATT AGATGAAACA AGAAAGACAG TATTAGTTCT CGGTGGAAGC 
CTTGGTGCTA AGCGTATAAA TGAGTTAATA GCTAATCACG CTAAAGATTT TGAGGAAACA 
GGTGTAAACG TTATTTGGCA AACTGGTAAG TTATACTATG AACAATATAA AACGCTTGAA 
GAAAATAAAC GTTTACAAGT GAAGGAGTAT ATAAACCGAA TGGATCTAGC ATATAGTGTA 
GCAGATATAA TTATTAGCCG TGCTGGTGCA GGATCTGTAA GTGAGCTTTG TATCGTAGGA 
AAACCTGTGA TCTTAATTCC TTCTCCAAAC GTAGCAGAAA ATCATCAAAT GAAAAATGCT 
ATGGCATTAG CTGTGGAAGA AGCTTGCTTA ATTATGAAAG AAAGCGAAAT GGAAGAGCAA 
TTTAAAAGAC AATTTATAAA TCTTTTAGAA GATGAAGCAA TGCAAGCAAA GCTTTCAGAA 
AATATAAAAA AACTAGCAAG GCCCAATGCA ACTAAAGATA TTGTAAACGA AATTGAACAT 
TTAATTAATC ATACTGCGTA G

Protein sequence

MSNLKFILSG GGTGGHIYPA IAIANELKNR YPDAEFLFVG AKDRMEMEKV PNAGYNIKGL 
WISGIQRKLT FTNLMFPFKL LSSLWKSRSI IKRFKPDVVI GTGGFASGPL LKMANSKNIP 
TLIQEQNSYA GITNKWLADK ANKICVAYDH MEKYFPAEKI IKTGNPVRQD IKDLDSKRAE 
GIDHFELDET RKTVLVLGGS LGAKRINELI ANHAKDFEET GVNVIWQTGK LYYEQYKTLE 
ENKRLQVKEY INRMDLAYSV ADIIISRAGA GSVSELCIVG KPVILIPSPN VAENHQMKNA 
MALAVEEACL IMKESEMEEQ FKRQFINLLE DEAMQAKLSE NIKKLARPNA TKDIVNEIEH 
LINHTA